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(57) Abstract 

System for the expression and secretion 
of an amino acid, a polypeptide or a protein 
determined by a corynebacteria strain. The 
system is characterized in that the sequence 
coding for said amino acid, polypeptide or 
protein is located in a chromosomal or plas- 
mid DNA region where said sequence is tran- 
scribed towards the 5' end with at least one 
part of the sequence coding for the signal se- 
quence of protein PS1 or PS2, said part secret- 
ing said protein after translation upon incor- 
poration of the system into said corynebacte- 
ria strain. 
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La presente nivention concerne un sys- 

teme d'expression et de secretion d'un amino-acide, polypeptide ou proteine determine par une souche de corynebacterie, caracte- 
rise en ce que la sequence qui code pour ledit amino-acide, polypeptide ou ladite proteine est situee dans une region d'ADN chro- 
mosomique ou plasmidique ou ladite sequence est transcrite avec vers 1'extremite 5' au moins une partie de la sequence codant 
pour la sequence signal de la proteine PS 1 ou PS2, ladite partie assurant la secretion de ladite proteine apres traduction lorsque le 
systeme est incorpore dans ladite souche de corynebacterie. 
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SYSTEME D'EXPRESSION ET DE SECRETION DE PROTEINES 
UTILISABLES EN PARTICULIER CHEZ LES CORYNEBACTERIES 

La presente invention concerne notamment des systemes 
d'expression et de secretion de proteines utilisables, en particulier, chez les 
5 corynebacteries, ainsi qu f un procede mettant en oeuvre ces systemes, ainsi 
que de nouvelles proteines liees a ces systemes d'expression. 

Les corynebacteries constituent un groupe de bacteries gram 
positif, de morphologie irreguliere, represente par une grande variete de 
souches. 

10 En depit du fait que les cellules gram positif ont une structure 

simple facilitant la secretion de proteines dans le milieu exterieur, la 
secretion des proteines par les corynebacteries a ete tres peu etudiee 
jusqu'ici. Seules la toxine diphterique secretee par certaines souches de 
Corynebacterium diphteriae infectees par des phages lysogeniques tox+ 

15 (Smith 1980 : 3. Bacteriol. 141 pp 11*2 ; Smith et al. 1980 : 3. Bacteriol. 
1*1 pp 18* ; Greenfield et al. 1983 : PNAS USA 80 pp 6853) et I'etude de la 
sequence nucleotidique d'un gene implique dans la secretion d'une DNase 
par Corynebacterium glutamicum (W. Liebl et A.S. Sinskey 1986 : Genetics 
and Biotechnology of Bacteria, Vol. 2 pp 383-388) ont ete rapportees. 

20 Le brevet americain US * 965 197 decrit un systeme 

d'expression et de secretion utilisable chez Corynebacterium sur la base de 
la DNAse decrite precedemment ; neanmoins il sembie que cette proteine 
ne soit pas majoritaire et que dans ces conditions, le systeme de secretion 
correspondant soit peu interessant. 

25 C'est pourquoi ^invention concerne un systeme depression et 

de secretion dans une bacterie de type corynebacterie comportant les 
elements de secretion de deux proteines se trouvant majoritairement dans 
le surnageant de culture de certaines corynebacteries, 

II s'agit notamment d'un systeme d'expression/secretion d'un 

30 amino-acide, polypeptide ou proteine determine par une souche de 
corynebacterie, caracterise en ce que la sequence qui code pour ledit 
amino-acide, polypeptide ou ladite proteine est situee dans une region 
d'ADN chromosomique ou plasmidique ou ladite sequence est transcrite avec 
vers Textremite V au moins une partie de la sequence codant pour la 

35 sequence signal de la proteine PS1 ou PS2, ladite partie assurant la 
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secretion dudit amino-acide, polypeptide ou de ladite proteine apres 
traduction lorsque le systeme est incorpore dans ladite souche de 
corynebacterie. 

Pius particulierement, la presente invention concerne un 
5 systeme d'expression et de secretion dans une corynebacterie comprenant : 

- une souche de corynebacterie, 

- une cassette de secretion contenant une premiere sequence d'ADN 
fonctionnelie pour l'expression dans ladite souche de corynebacterie, une 
seconde sequence d'ADN qui code pour un aminoacide, un polypeptide et/ou 

10 une proteine, et une troisieme sequence d'ADN inseree entre lesdites 
premiere et seconde sequences d'ADN qui codent pour des elements d'une 
proteine choisie parmi PS1 ou PS 2, qui assurent la secretion desdits 
amino-acides, polypeptides et/ou proteines par ladite souche de coryne- 
bacterie. 

15 II doit tout d'abord etre compris que dans le cadre de la 

presente invention la terminologie "corynebacterie" designe non seulement 
les souches du genre Corvnebacterium mais egalement les bacteries 
apparentees, telles que Brevibacterium. 

Le systeme d'expression de la presente invention peut se 

20 trouver sur un plasmide autoreplicatif dans corynebacterie et dans ce cas, 
le plasmide comportera une origine de replication fonctionnelie dans la 
souche, par exemple dans Corvnebacterium une origine de replication 
PBL I, mais peut egalement etre portee par un plasmide non replicatif 
destine notamment a l'integration chromosomique, dans ce cas le plasmide 

25 comportera des elements permettant la recombinaison et ^integration 
chromosomique ; dans le cas de l'integration, le systeme d'expression se 
trouvera finalement dans le chromosome de la bacterie en cause. 

En particulier, dans le cas de l'integration chromosomique, on 
a pu demontrer que l'insertion d'une sequence d'ADN heterologue dans le 

30 gene csp! codant pour PS I ou csp2 codant pour PS2 n'affectait pas la 
croissance de la souche correspondante. Dans ces conditions, il est possible 
d'integrer une sequence codant pour un amino-acide, un polypeptide ou une 
proteine en phase dans csp! ou cso2 afin d'obtenir 1'expression/secretion 
des produits d'expression de la sequence codante inseree. 

35 Parmi les sequences d'ADN fonctionnelies pour l'expression 

dans la souche de corynebacterie il faut citer aussi bien des elements 
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d'expression homologues que des elements depression heterologies, 
c'est-a-dire qu'il peut s'agir d'elements qui existent deja dans la bacterie 
hote ou bien qui au contraire, proviennent d'une bacterie differente. 

Ces elements d'expression comporteront essentiellement un 
promoteur et un site de fixation des ribosomes, mais il est possible 
egaiement de prevoir d'autres elements notamment du type elements de 
regulation de l'expression. 

Parmi ies elements depression utilisables dans ies coryne- 
bacteries, on utilisera plus particulierement le promoteur Ptac qui est un 
promoteur fort, hybride trp/lac inductible par IPTG et qui se revele 
fonctionnel chez les corynebacteries comme chez E. coli ; mais il est 
possible d'utiliser d'autres promoteurs, par exemple, comme cela sera decrrt 
ci-apres, des promoteurs ou d ! autres elements d'expression de gene de 
structure de corynebacterie, par exemple le promoteur de la gdhA. II est 
possible egaiement de prevoir d'utiliser, par exemple, les elements 
d'expression, notamment le promoteur de Tune des proteines PS1 et/ou PS 2 
tels qu'ils sont identifies dans le cadre de la presente invention. 

Les elements d'expression peuvent egaiement comporter des 
sequences d'ADN assurant la regulation de 1'expression des genes en aval. 

Parmi ies elements assurant une bonne expression on peut 
prevoir de pouvoir placer a la fin de la sequence codante un element 
d'arret de traduction, sous forme d'un ou plusieurs codons stop, ou un 
element d'arrSt de la transcription. 

Parmi les elements assurant la secretion il faut citer, comme 
cela a ete indique precedemment, tout ou partie de la sequence signal de 
1'une des proteines PS1 ou PS 2 ainsi que ies equivalents de ces sequences, 
sans modification ou perte de la propriete de secretion. 

En effet, il est certain qu'il est possible d'apporter grSce a des 
techniques connues telles que des mutations ponctuelles des modifications 
mineures aux sequences de secretion, tout en conservant le meme type de 
propriete de secretion, c'est pourquoi la presente invention entend 
egaiement couvrir ces sequences equivalentes. 

Le systeme d'expression de la presente invention peut enfin 
comporter d'autres elements, notamment des elements tels que des 
terminateurs de transcription, par exemple le terminateur des proteines 
PS1 et/ou PS 2, ou de la gdhA. 
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Dans certains cas, il peut etre interessant d'adjoindre aux 
sequences d'expression et de secretion, toute ou partie de la proteine PS1 
afin d'obtenir des proteines fusionnees, dont ia secretion et le taux 
d'expression peuvent dans ces conditions etre ameliores. 

Les systemes d'expression selon I'invention, peuvent comporter 
des elements heterologues qui permettent la construction dans des 
bacteries differentes des corynebacteries par exemple comme cela a ete dit 
precedemment une origine de replication fonctionnelle dans E^.coli mais 
egalement d'autres elements comme un gene .marqueur qui peuvent f aciliter 
ie transfert dans Corynebacterium. 

Le gene marqueur peut Stre, bien entendu, de type tres vane 
pour autant qu'il soit fonctionnel chez corynebacterie, il pourrait s'agir d'un- 
gene de selection positif ou negatif tel qu'une resistance specifique, 
neanmoins dans l'etat actuel des recherches ces genes ne sont pas aisement 
15 disponibles. On utilisera done de preference le gene celA de ia cellulase de 
Clostridium thermocellum (celA) qui confere le phenotype CMC*, mais U 
est possible d'utiliser d'autres genes marqueurs, notamment lacZ d' E. coli. 

Dans le cas ou le gene marqueur est celA, les bacteries 
transformees sont selectionnees pour le caractere CMC* apres insertion de 
20 ia sequence codante dans un site de restriction approprie comme BstXl. 

Dans le procede selon I'invention, on prevoiera, de preference, 
que le gene marqueur puisse €tre facilement elimine apres verification de 
la construction notamment en placant des sites de restriction entre le gene 
marqueur et la sequence codante. 
25 La sequence codante pourra etre naturelle, synthetique ou 



mixte. 

Le systeme d'expression et de secretion de la presente 
invention est bien entendu destine plus particulierement a assurer la 
production de produits d'interet industriel, e'est pourquoi les sequences 
30 codantes coderont plus particulierement pour un peptide, un polypeptide, 
ou une proteine d'interSt industriel mais il pourra egalement s'agir d'une 
sequence codant non pas directement pour une proteine d'interet industriel, 
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mais pour une proteine pouvant mtervenir dans ia maturation et/ou 
I'elaboration d'un aminoacide, d'un polypeptide, ou d'une proteine 
r presentant un interet industriel. 

Les procedes selon I'invention sont plus particulierement 
5 destines a I'expression de sequences d'acides amines, notamment des 
sequences repetitives, il s'agit done principalement de sequences synthetiques. 

Cette seconde sequence de DNA codant pour ces differents 
produits pourra egalement comporter certains elements destines a assurer 
la maturation du produit secrete. 
10 Dans le cas d'une sequence synthetique, le choix de la 

sequence codante permet la constitution : 

- d'une sequence d'acides amines quelconque ; 

- d'une sequence d'acides amines repetitive a n repetitions du 
type (aa ........ aa ) ; 

1 . - d'une sequence repetitive contenant en position COOH- 

terminale aa x un acide amine charge positivement ou negativement. Cet 
acide amine peut permettre d'ameliorer ^expression genetique mais permet 
avantageusement 

(i) d'isoler le polypeptide du fait de son caractere ionique marque ; 
20 (ii) de cliver par protease specif ique le polypeptide en unite (aa^. — aa x > ; 
(iii) d'enlever si necessaire Tacide amine terminal aa x par des carboxy 
peptidases specifiques ; 

- d'une sequence repetitive contenant en portion NH 2 ou 
COOH terminale aa^ ou aa x un acide amine conferant un avantage desire. 

^ Dans les exemples, la sequence exprimee code pour un polypeptide de 
structure (ala-gln^Q et (aia-gln-lys)^. La sequence ala-gln ou ala-gln-lys 
peut Stre liberee par traitement enzymatique ulterieur. On peut prevoir 
d'autres poiymeres de ce type tels que Ala-Gln-Tyr ou Ala-Gin-Met qui 
peuvent etre liberes par traitement enzymatique ou chimique. 

*° Le choix des codons de la sequence codante peut influencer 

1'expression dans les corynebacteries, il convient de preference de prevoir 
une sequence ay ant une richesse en GC de l'ordre de 50 a 60 %. 
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Dans le cas de I'exemple la sequence codant pour (AQ) 2Q est 
GCX CAG avec X = A ou T ou C ou G ; en eff et si aucun des codons n'est 
prefere pour 1'alamne, par contre le codon CAG est tres nettement prefere 
pour ia giutamine. Dans ce cas, le pourcentage de GC est de I'ordre de 
5 75 96, ce qui peut constituer une limitation, c'est pourquoi on envisage 
Tutilisation de polymeres comportant 3 amino-acides dont le troisieme est 
riche en A et T pour ramener le pourcentage a 55 96. 

Tyr, Lys et Met possedent deux A ou T dans les deux 
premieres bases de leur codon et permettent done de faire descendre le 

10 pourcentage en GC de 75 % a environ 60 96, ce qui devient plus proche du 
pourcentage en GC trouve chez les corynebacteries. D'autres part, bien sur, 
Pinteret industriel pour ces deux acides amines en position COOH-terminal 
de la giutamine (Q) a ete considere et existe. 

La presente invention concerne egalement les souches de 

15 corynebacteries comportant un systeme depression et de secretion tel 
qu'il a ete decrit precedemment, et plus particulierement lorsque la souche 
est une Brevibacterium notamment une souche de Brevibactenum 
lactofermentum. 

Enfin, la presente invention concerne un precede d'obtention 

20 d'aminoacides, de polypeptides, ou de proteines caracterise en ce que Ton 
cultive dans un milieu de culture une souche de corynebacterie transformee 
telle que cela a ete decrit precedemment, dans laquelle la seconde 
sequence de DNA code pour lesdits aminoacides ledit polypeptide, et/ou 
ladite proteine et en ce que Ton separe eventuellement apres culture ledit 

25 produit du milieu de culture. En effet, grace a ce precede, le produit 
interessant a ete secrete et se trouve done dans le milieu de culture duquel 
il peut €tre isoie par des precedes connus, qu'il s'agisse de techniques de 
separation telles que la chromatographic, ia precipitation selective par 
exemple, ceile-ci devant etre adaptee evidemment a la nature de la 

30 molecule produite. 

II est egalement possible de prevoir la separation du 
concentrat bacterien puis la separation de la proteine determinee, 
fusionnee ou non avec PS1 ou P52 a partir de ce concentrat, par exemple 
par utilisation d'un agent tensio-actif. En ffet, PS1 t PS2 etant des 
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proteines parietales, une partie des proteines secretees avec ce systeme 
restent ancrees dans la paroi, ce qui peut faciliter leur separation car avec 
certains detergents la bacterie n'est pas lysee. 

La transformation des corynebacteries par des plasmides est 
5 realisee de preference par electro poration (Bonamy C, Guyonvarch A., 
Reyes O., David F. and Lebion G. (1990) FEMS Microbiology Letters 66 : 
263-270) ou par tout autre procede approprie. 

Les conditions de fermentation permettant la preparation 
d'amino acides, peptides et/ou proteines dependent evidemment du type de 
10 produit obtenu ainsi que de la souche specifique mise en oeuvre, il s'agit la 
d ! elements qui doivent etre determines specifiquement pour chaque souche 
en fonction des connaissances de l'homme de metier. 

La presente invention concerne egalement des systemes 
d'expression comportant tout ou partie des signaux d ! expression de cspl, 
15 csp2 et de la gdh A ou tout ou partie de ces trois genes, ainsi que les 
souches exprimant ce type de systemes, notamment les souches de 
corynebacteries. 

Dans les procedes mettant en oeuvre les constructions 
decrites, I'expression/secretion de l'amino-acide, polypeptide ou proteine 
20 determine sera regulee par la temperature, le milieu de culture et/ou la 
nature des sucres pour PS1 et PS2 et la concentration en sels (NH^ + 
notamment), metabolites (glutamate) et sucres (glucose/fructose) pour les 
systemes a gdhA. 

La presente invention concerne egalement les proteines 
25 comportant tout ou partie de la sequence de PS1 ou PS2, en particulier 
comportant un ou plusieurs sites antigeniques de ces proteines. Lesdites 
proteines peuvent etre utilisees a titre d'element atypique, notamment dans 
des trousses de diagnostic, de meme que les anticorps correspondants. 

L'invention concerne egalement les souches de corynebacteries 
30 dans lesquelles la proteine determinee est ancree sur la paroi par la partie 
de PS1 ou PS2 remplissant cette fonction d'ancrage ou bien dans lesquelles 
les epitopes antigeniques de PS1 ou PS 2 sont exposes sur la paroi. 

Les exempies ci-apres sont destines a mettre en evidence 
d'autres caracteristiques et avantages de la presente invention et ne sont 
35 en aucun cas limitatifs. 
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Figure 1. Schema du plasmide pCGL612. Plasmide derive du pUN121 ( Nilsson, 
B., Uhlen, M., Josephson, S., Gatenbeck, S., and Philipson, L. (1983) An 
improved positive selection plasmid vector constructed by oligonucleotide mediated 
mutagenesis. Nucleic Acids Res 11: 8019-8029.) contenant un fragment de 2,6 kb de 
5 C. melassecola ATCC17965 portant 1' integrality du gene cspl permettant la synthese 
de la proteme PS1. 

Figure 2- Sequence nucleotidique et sequence d' acides amines correspondante du 
gknecspl de Corynebacterium glutamicum dite Corynebacterium melassecola 
ATCC17965. La numerotation des nucleotides est presente sur le c6tg droit de la 
' 10 figure. Les sequences nucleotidiques repetees sont entourees. La sequence probable 
Shine-Dalgarno est soulignee. Un palindrome de 24 pb qui correspond 
vraisemblablement au terminateur de transcription est indique par des fleches 
inversees. Cette sequence apparait dans la banque de donnees de sequences 
nucleotidiques EMBL sous le numero d 1 acces X66078. 
15 Figure 3. Carte de restriction de la region d' ADN de C. melassecola ATCC17965 
sequencee portant cspl. 

Figure 4. Alignement des sequences de la proline PS1 de C. glutamicum et des 
proteines du complexe antigenique 85 de Mycobacterium. 85B M. k. represente 1' 
antigene 85-B de M. kansati (MIPSG16235). 85B M. b. represente 1' antigene 85-B 

20 de M. bovis (MIPSC83179). 85B M. I represente 1' antigene 85-B de M. leprae 
(EMBLX60934). 85C M. t. represente 1' antigene 85-C de M. tuberculosis 
(EMBLX57229). 85A M. b. represente l* antigene 85-A de M. bovis (MIPSA28544). 
85A M. I. represente 1' antigene 85-A de M. tuberculosis (MIPSI60062). Les 
sequences ont 6t6 alignees en utilisant le programme FastA de "Genetics Computer 

25 Group" (University of Wisconsin, USA). La numerotation des residus est donnee 
pour chaque proline au d^but de chaque ligne. Les residus d' acides amines similaires 
trouves entre les differentes proteines sont entoures. Les residus cosideres comme 
similaires sont les suivants; acides ou amides (D, E, N, Q); basiques (H, K, R); 
polaires (P, A, G, S, T); non polaires (I, L, M, V) et aromatiques (F, W, Y). Us 

30 residus d' acides amines identiques entre les sept proteines sont indiques par une etoile 
au-dessus des residus concerned. 

remarque: pour chaque antigene, le numero d' accession est precis^ associe au nom de 
la banque de donnees consideree et figurent entre parentheses. 
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Figure 5, Interruption du gene cspL 

Integration dans le chromosome d' un gfene cspl interrompu. pCGL613' est non 
r^plicatif chez C. glutamicum , il contient cspl ( zone noircie ) interrompu par le gene 
aphA3 (Km), wt, B. lactofermentum 15 sauvage et bcspl, V integrant contenant cspl 
5 interrompu. 

Figure 6. Construction du plasmide pCGL616. 

Le plasmide pCGL616 correspond au plasmide pCGL125 dote du gfene cspl de C. 
glutamicum. 

Figure 7. Plasmides permettant la synthase de proteines PS1 tronqudes. 
10 Schema des vecteurs derives de pCGL616, precision de la taille des proteines 
attendues et de leur detection (+) ou non (-) par Western blotting avec des anticorps 
polyclonaux anti-PS 1. 

Figure 8. Construction du plasmide pCGL1030. La region nommee A dans le* 
schema contient le promoteur de cspl suivi de la region d' ADN correspondant k la 
15 sequence signal de PS1 et des 30 premiers acides aminds de sa sequence mature. 

Figure 9. Construction du plasmide 1031. La region nommee A est decrite dans la 
figure 8. La region de jonction entre PS1 et EGA a 6t€ s£quenc£e et le detail de cette 
sequence est present^. 

Figure 10, Construction du plasmide 1032. La region nommee A est decrite dans la 
20 figure 8. La region de jonction entre PS1, (AQK)10 et EGA a 6t6 sequencee et le detail 
de cette sequence est presents 

Figure 1 1. Construction du plasmide 1033. La region nommee A est decrite dans la 
figure 8. La region de jonction entre PS1, (AQ)19 et EGA a 6t6 sequencee et le detail 
de cette sequence est pr&entd. 
25 Figure 12. Sequence nucteotidique et sequence d' acides amines correspondante du 
gfene csp2 de Corynebacterium glutamicum dite Corynebacterium melassecola 
ATCC 17965. La num^rotation des nucleotides est prdsentde sur le col6 droit de la 
figure. La sequence probable Shine-Dalgarno est soulignfe. Un palindrome de 22 pb 
qui correspond vraisemblablement au terminateur de transcription est indique par des 

30 flfcches invers&s. 

Figure 13, Carte de restriction de la region d 1 ADN de C. melassecola ATCC17965 
sequence portant cspl. 

Figure 14. Interruption du gfcne cspl chez C. glutamicum. 
Integration chromosomique du gene interrompu. Le plasmide pCGL830 non replicatif 
35 chez G glutamicum, porte le gfene cspl interrompu par le gfene aphllL Le sens de 
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transcription des genes aphlll et csp2 est represent par une Heche sur le plasmide 
pCGL830. Wt, represente ia souche B. lactofermentum 15 et csp2 :: aphlll, 
[Integrant avec le gene csp2 interrompu. 

Figure IS. Translocation de PS I en fonction de la temperature. 10 ml de culture en 
5 phase exponentielle (DO650=l) a 34°C ont dte marque's avec la methionine 35S (37 
TBq/mmoie, 16nM en concentration finale) durant 1 mn. A la fin du pulse du 
chloramphenicol (100/<g/ml) et de la methionine 32S (concentration finale 0,5 mM) 
sont alors ajoutes. 1ml d' aliquote est preieve et rapidement refroidi a Ia temperature 
indiquee. V incubation est continuee a cette temperature pendant 30 mn et la fraction 

10 secretee parietale de PS1 est extraite. L* extrait est alors soumis a un SDS-PAGE et 
autoradiographic* (a). L' intensite des bandes est determinee par densitometrie (b, axe 
de gauche) et est donnee en unite arbitaire, sur une base de 100 a 34°C. La 
translocation est fonction de la transition de phase des lipides de la membrane. 
Figure 16. Carte de restriction du gene gdhA. 

15 Figure 17. Sequence complete du fragment Nhel-Blgl contenant le gene gdhA de 
C. melassecola. 

Figure 18. Construction de pCGL141 et pCGL142, vecteurs de fusion entre le 
promoteur du gene gdhA et le gene lacZ. 
Figure 19. Oligonucleotides utilises dans les constructions. 
20 Figure 20. Construction de pPROK(AQ)20celA 

Figure 21. Detail de construction placantle gene synthetique entre p&cetle gene 
celA - a) construction placant ceLA sous le controle de ptac, b) devenir de la 
construction apres introduction du polypeptide AQ. 
ptac : promoteur toe 
25 RBS « site de liaison ou ribosome 

ES3 : sequence synthetique en 5 du gene celA perrnettqnt I'lntroduction de lo 

sequence equivalente au polypeptide AG et so fusion a dautres genes eventuels 

• nucleates* introduits au site BstXl equivalents ou polypeptide AQ 
C=| :se|j 5 encf?ADN equivalent a une partie dela sequence signal d'EGA 
30 M :- sequence d'ADN equivalent a la se'quence codante d'EGA 
JL : terminateur de transcription 
p : premier acide amine appartenant a la se'quence signal d'EGA 

Figure 22. Structure de pCGL125. 
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Exemple 1, Identification de PS1 et de PS2 dans le surnageant de 
culture et dans la paroi de Corynebacterium elutamicum. 

L f analyse d ! un gel de polyacrylamide en condition ddnaturante (SDS-PAGE) 
5 (Laemmli, U. K. (1970) Cleavage of structural proteins during the assembly of the 
head of bacteriophage T4. Nature 227: 680-685.) d' un surnageant de culture de la 
souche Corynebacterium melassecola ATCC 17965, actuellement reddfinie comme une 
souche de Corynebacterium glutamicum (Jones, D., and Collins, M. D. (1986) 
Irregular nonsporing Gram-positive rods. In Bergey's Manual of Systematic 

10 Bacteriology. Williams and Wilkins (eds). Baltimore, vol. 2, pp. 1261-1434.) montre 
deux proteines majeures nomm£es PS1 et PS2 de masse moleculaire approximative 
67000 et 63000 respectivement. Les concentrations de PS1 et de PS2 suivent la 
courbe de croissance de la bact£rie et atteignent leur maximum en phase stationnaire. 
Une fraction secr6t£e importante de ces prolines et surtout pour PS2 est egalement 

15 situde dans la paroi de la bact^rie. Pour extraire PS1 et PS2 de la paroi un traitement 
des bacteries au SDS est utilisd, qui ne provoque pas de lyse significative de la 
bactdrie. Ainsi, pour obtenir une concentration maximale de PS1 et de PS2, il est done 
possible de cumuler les deux fractions s£cr€t£es, surnageant de culture et fraction 
paridtale, et d ! obtenir une preparation finale oil PS1 et PS2 sont fortement 

20 majoritaires. Des anticorps polyclonaux ont 6t6 prepares contre PS1 et PS2, il n 1 y a 
pas de reaction immunologique croisde entre les deux prolines ce qui montre bien que 
ces prolines sont diffdrentes. Des proteines ayant de fortes reactions immunologiques 
croisdes avec PS1 et PS2 ont €i€ trouv^es dans le surnageant de culture de souches 
bacteriennes apparentees & Corynebacterium melassecola ATCC 17965 comme la 

25 souche Brevibacterium lactofermentum 15 (Bonnassie, S. f Oreglia, J., Trautwetter, 
A., and Sicard, A. M. (1990) Isolation and characterization of a restriction and 
modification deficient mutant of Brevibacterium lactofermentum. FEMS Microbiol 
Letters 72: 143-146.), Brevibacterium lactofermentum ATCC21086 et 
Brevibacterium flavum ATCC 14067. PS1 et PS2 ont 616 testes pour plusieurs 

30 activitds enzymatiques incluant I 1 activity invertase, pectinase, nuclease, collagenase, 
amylase, bact£riocine, endoglucanase et protease h large spectre. Aucune de ces 
activity enzymatiques n 1 a pu etre associee & PS1 ou PS2. 



35 
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Exemgle 2. Evidence de la fonctionalite du pe ptide signal de PS1 chez 
Escherichia coli (Figure 1). 

Lorsque Ie gene cspl porte" par le plasmide pCGL612 (Figure 1) est exprime" 
5 chez E. coli TGI, 1' analyse par Western blotting d 1 un extrait brut de ce recombinant 
avec les anticorps anti-PS 1 revele la presence d' une proline majeure qui a la meme 
masse moieculaire que la proteine PS1 presente dans le surnageant de culture de C. 
melassecola . Une proteine mineure de masse moieculaire legerement superieure est 
egalement detectee. En fait la bande proteique majeure correspond a la forme mature 

10 de PS1 (sans sequence signal) et la bande proteique mineure a la forme pre"curseur de 
PS1 (avec la sequence signal). 

En effet, dans une premiere experience, la liberation des prolines 
penplasmiques (enzymes secret^es) de la souche recombinante E. coll 
TGl(pCGL612) par choc osmotique (Heppel, L. A. (1967) Selective release of 

15 enzymes from bacteria. Science 156: 1451-1455.) et la detection du contenu en 
prot&nes liberies par Western blotting avec des anticorps anti-PS 1 ne r€vele que la 
proteine majeure. L 1 activity isocitrate dehydrogenase (Shiio, I., and Ujigawa, K. 
(1978) Enzymes of the glutamate and aspartate synthetic pathways in a glutamate- 
producing bacterium, Brevibacterium flavum. J Biochem 84: 647-657.) de la souche a 

20 6t6 mesuree en guise de contrdle de lyse; cette lyse a ete estimee dans cette experience 
a moins de 1%. Ceci amene a la conclusion que la bande proteique majeure 
correspond a la forme mature de PS1 et que la proteine est exportee a travers la 
membrane cytoplasmique d' £. coll 

Dans une deuxieme experience, 1' extrait brut de la souche recombinante £. 

25 coli TGl(pCGL612) a 6\& analyst par Western blotting avec les anticorps anti-PS 1 
avant et apres addition de chloramphenicol pour inhiber la synthese protfique. La 
bande mineure disparait progressivement apres 1' inhibition de la synthese proteique. 
Cette bande mineure de PS 1 ne disparait pas si on ajoute 5 minutes avant 1' addition de 
chloramphenicol, le CCCP (carbonyl cyanide m-chlorophenylhydrazone), un 

30 protonophore qui dissipe la force proton-motrice a travers la membrane 
cytoplasmique. La disparition de la bande mineure de PS1 n' est done pas le resultat 
d' une degradation par les proteases. Sa disparition progressive apres inhibition de la 
synthese proteique et son absence du periplasme sont en accord avec 1' hypothese de 
la maturation de cette forme precurseur par une sequence signal peptidase situee dans 

35 la membrane et sa translocation a travers la membrane cytolasmique. Ce resultat 
montre egalement que chez E. coli la maturation de PS1 est dependante de la force 
proton-motrice, in vivo. 
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Exemple 3. Sequence nucleotidiaue du gene csvl codant pour PS1 



Le sequence d' un fragment de 2547 paires de base contenant le gene codant 
pour PS1, nomm6 cspl> et de la region en amont a €i€ r£alis£. La sequence 
5 nucleotidique est presence dans la figure 2 (s&juence ID n° 1). La figure 3 represente 
la carte de restriction de cette region s^quencee. 

Par analyse informatique, une phase ouverte de lecture de 1971 paires de base 
a 6t6 identifiee correspondant k 657 acides amines. 

Les signaux putatifs de demarrage de traduction 

10 (GAGAAGGAAAACTTCATG) et de demarrage de transcription (TACATA(-35) et 
TAAGAT(-IO) ont €\& identifies. La sequence AGAAGGA extraite du site de fixation 
aux ribosomes ddcrit ci-dessus est comptementaire (soulignage) de l f extrdmitS 3* de 1 ! 
ARNr des bacteries de type Gram positive Staphylococcus aureus et Steptomyces 
lividans (5'-GAUCACCUCCU UUCU OH-3 f ) (McLaughlin, J. R., Murray, C. L., 

15 and Rabinowitz, J. C. (1981) Unique features of the ribosome binding site sequence 
of the Gram positive Staphylococcus aureus B-lactamase gene. J. Biol Chem.256: 
11283-11291.) (Bibb, M. J., and Cohen, S. N, (1982) Gene expression in 
Streptomycey. Construction and application of promoter-probe plasmid vectors in 
Streptomyces lividans. Mol Gen Genet 187: 265-277.). La region d' ADN en 5' 

20 pr£cddant le codon de demarrage de la traduction contient deux sequences 
nucldotidiques AAAAGTTATCCACAG et ATTGAAAAA r6pdt£es chacune deux fois, 
de 28 k 42 et de 70 k 84 pour la premiere, puis de 100 k 108 et de 171 k 179 pour la 
deuxifeme. Ces deux sequences pourraient etre impliquees dans la regulation de la 
transcription du gfene cspL 

25 En ce qui concerne les signaux de secretion, une sequence k V extremite NH2 

de la proline pr£sente les caract^ristiques d 1 une sequence signal de bacterie de type 
Gram-positive (Watson, M. E. E. (1984) Compilation of published signal sequences. 
Nucleic Acids Res, 12: 5145-5164.). Cette sequence signal comporte un excfes de 
charge positive en position NH2-terminale (7 acides amines k charge positive dans les 

30 18 premiers acides amines), suivi d ! une sequence avec un excfcs d f acides amines non 
polaires (18 acides amines non poiaires dans les 23 acides amines suivants) puis de 
deux sequences d 1 acides amines putatives d 1 un site de clivage de sequence signal 
(pro thr ala ile ala, en position 28 k 32) (pro met ala ser ala, en position 39 k 43). 
Parmi ces deux sequences d f acides amines putatives d 1 un site de clivage de 

35 sequences signal, la deuxifcme = pro met ala ser ala en position 39 k 43 semble la plus 
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probable; en effet, la proteine PS1 a ete purifiee du surnageant de culture de 
Corynebacterium glutamicum jusqu' a homogeneite electrophoretique par deux 
protocoles diffeients (voir exemple 5) et les preparations ont ete utilisees pour 
determiner la sequence amino-terminale par la degradation d' Edman. Aucun signal n' 
5 a.6t6 obtenu, bien que 5 nmoles de proline purifiee aient 6t6 utilisees. Comme deux 
protocoles de purification ont 6t6 utilises, il est probable que la proteine PS1 soit 
bloquee in vivo et que le blocage ne soit pas une consequence de la technique de 
purification utilisee. La deuxieme sequence de clivage proposee ferait apparaitre une 
glutamine (position 44) comme premier acide amine - de la sequence mature, facilement 

10 convertie en acide pyroglutamique rendant impossible le sequencage amino-terminal 
de la proteine par la technique d 1 Edman. 

Un site putatif de terminateur de type rho dependant est trouve dans la region 
3' du gene a 55 nucleotides des trois codons stop och-amb-opa (Rosenberg, M., and- 
Court, D. (1979) Regulatory sequences involved in the promotion and termination of 

15 RNA transcription. Annu Rev Genet 13: 319-353.). Le AG de cette structure en 
epingle a cheveux est egal a -35,7 kcal/mole (Freier, S. M., Kierzek, R., Jaeger, J. 
A., Sugimoto, N., Caruthers, M. H., Neilson, T., and Turner, D. H. (1986) 
Improved free-energy parameters for predictions of RNA duplex stability. Proc Natl 
Acad Sci USA 83: 9373-9377.) 

20 La masse moleculaire calculee correspondant aux 657 acides amines contenus 

dans la phase de lecture ouverte est de 70874. Or la masse moleculaire de la sequence 
signal la plus probable (site de clivage entre 1' acide amine 42 et 43) est de 441 1, ce 
qui donne une masse moleculaire calculee pour la proteine mature de 66463 et qui est 
tres proche de la valeur de 67000 estimee sur gel de polyacrylamide denaturant 

25 Les caracteristiques de la sequence sont rappelees ci-apres: 

de 239 a244TACATA (signal -35) 
de 269 a 274 TAAGAT (signal -10) 
de 405 a 414 GAGAAGGAAA site de fixation des ribosomes 
de 420 a 2390 sequence codante 

30 de 420 a 548 peptide signal de proteine secretee 

de 2455 a 2506 structure en epingle a cheveux, signal de terminateur de type rho 
dependant . 



35 
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Exemple 4. Homologies de sequences entre PS1 de Corvnebacterium 
glutamicum et les proteines du complexe antigeniaue 85 de 
Mycobacterium. (Figure 4). 

5 La moitte NH2 de la proline PS1 est tres similaire aux trois antigenes 

mycobacteriens s€qt6i€s nommes 85-A, 85-B et 85-C (Closs, O, Harboe, M., 
Axelsen-Christensen, N. H., and Magnussen, M. (1980) The antigens of 
Mycobacterium bovis, strain BCG, studied by crossed immuno-electrophoresis: a 
reference system Scand J. Immunol 12: 249-263.)(Wiker, H. G., Harboe, M., 

10 Nagai, S., and Bennedsen, J. (1990) Quantitative and qualitative studies on the major 
extracellular antigen of Mycobacterium tuberculosis H37Rv and Mycobacterium bovis 
BCG. Am Rev Respir Dis 141: 830-838.). Les trois gfenes correspondants de 
differentes especes mycobacteriennes ont ete clones et s^quencds: antigene 85-A de* 
Mycobacterium bovis BCG1173P2 et de Mycobacterium tuberculosis ( Borremans, 

15 M., De Wit, L., Volckaert, G., Ooms, J., De Bruyn, J., Huygen, K., Van Vooren, 
J.-P., Stelandre, M., Verhofstadt, R., and Content, J. (1989) Cloning, sequence 
determination, and expression of a 32-kilodalton-protein gene of Mycobacterium 
tuberculosis. Infect Immun 57: 3123-3130.) ( De Wit, L., De la Cuvellerie, A., 
Ooms, J M and Content, J. (1990) Nucleotide sequence of the 32 kDa-protein gene 

20 (antigen 85A) of Mycobacterium bovis BCG. Nucleic Acids Res 18: 3995.), 1' 
antigfcne 85-B de Mycobacterium bovis Tokyo, Mycobacterium kansaii et 
Mycobacterium leprae (Matsuo, K., Yamaguchi, R., Yamazaki, A., Tasaka, H., and 
Yamada, T. (1988) Cloning and expression of the Mycobacterium bovis BCG gene 
for extracellular a antigen. J. Bacteriol 170: 3847-3854.) (Matsuo, K., Yamaguchi, 

25 R. f Yamazaki, A., Tasaka, H., Terasaka, K., and Yamada, T. (1990) Cloning and 
expression of the gene for the cross-reactive a antigen of Mycobacterium kansaii. 
Infect Immun 58: 550-556.) (De Mendon9a Lima, L., Content, J., Van Heuverswyn, 
H., and Degrave, W. (1991) Nucleotide sequence of the gene coding for the 85-B 
antigen of Mycobacterium leprae. Nucleic Acids Res 19: 5789.), et V antigfcne 85-C 

30 de Mycobacterium tuberculosis ( Content, J M De La Cuvellerie, A. t De Wit, L., 
Vincent-Levy-Frebault, V., Ooms, J., and De Bruyn, J. (1991) The genes coding for 
the antigen 85 complexes of Mycobacterium tuberculosis and Mycobacterium bovis 
BCG are members of a gene family: cloning, sequence determination, and genomic 
organization of the gene coding for antigen 85-C of M. tuberculosis. Infect Immun 59: 

35 3205-3212.). La proline PS1 de Corynebacterium glutamicum prfsente environ 33% 
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de residus identiques (o=l,l) et environ 52% de residus similaires (o=l,l) avec ces 
six prolines sur une longueur d' environ 330 acides amines (47- 5). Cette longueur d' 
environ 330 acides amines correspond pour les antigfcnes mycobactenens a la 
longueur totale de la proteine. Toutes ces proteines mycobacteriennes, tout comme 
5 PS1, contiennent une sequence signal d' une longueur comparable aux plus longues 
sequences signal trouvees chez les bacteries de type Gram-positives (environ 42 
acides amines, o=2,4). La proline 85-B de M. bovis et la proteine 85-C de M. 
tuberculosis, tout comme PS1, ont une plus longue region NH2 hydrophile (5 ou 
plus, de residus charges positivement) que la plupart des sequences signal. Une autre 

10 caractenstique interessante de toutes ces sequences signal est la presence en position 3 
ou 5 d' un residu acide, 1' acide aspartique, sauf pour I' antigene 85-C de M. 
tuberculosis ou il s' agit d' un acide glutamique. La presence d' un residu charge acide 
est commun aux extremites NH2 des sequences signal Eucaryotes, mais est tout a fait 
inhabituelle aux extremites NH2 des sequences signal Procaryotes (Perlman, D., and 

15 Halvorson, H. O. ( 1983) A putative signal peptidase recognition site and sequence in 
eucaryotic and procaryotic signal peptides. J Mol Biol 167: 391-409.) (Watson, M. E. 
E. (1984) Compilation of published signal sequences. Nucleic Acids Res. 12: 5145- 
5164.). La raison de cette particularity n' est pas connue. Aucune autre similitude 
significative n' a €t£ trouvee entre PS I et d' autres prolines presentes dans les 

20 banques de donnees EMBL/ MIPS. 

Exemelg 5. Protoeoles de purification de PS1 et PS2 utilises en vue de 
la determination de la sequence N-terminale. 

25 Protocole 1 : 

Les proteines PS 1 et PS2 ont 6t6 purifiees a partir du sumageant de culture de 
C. glutamicum ATCC 17965 par electrophorese preparative sur gel de polyacrylamide 
et electrocution. 

Les bacteries, cultiv&s dans 200 ml de milieu riche LB a 34°C, sont recoltees 
30 en phase stationnaire de croissance par centrifugation a 8000 g pendant 15 minutes et a 
4°C. Les prolines du surnageant de culture sont ensuite pr^cipitdes au sulfate 
d'ammonium 60% et recoltees par centrifugadon a 13000 g pendant 15 minutes a 4°C. 
Le culot est solubilise" dans 4 ml de tampon Tris HC1 10 mM pH 6.8 et la solution est 
ensuite dialysee pendant 24 heures a 4°C dans ce meme tampon. 

35 
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L'extrait proteique dialyse obtenu apres precipitation au sulfate d ! ammonium est 
depose sur un gel d'electrophorfcse de format 16 x 20 x 0,75 cm. L'eiectrophorfcse est 
realise selon le protocole decrit par Laemmli (1970) en utilisant un gel de concentration 
k 4% et un gel de separation a 7,5%. La migration se fait en quinze heures a 40mA. 
5 Les gels sont ensuite colores au chlonire de cuivre selon le protocole decrit par Lee et 
al (1987). Les bandes proteiques correspondant aux proteines PS1 et PS2 sont 
decoupees puis totalement decolorees. Les proteines sont ensuite electroeluees du gel 
pendant 5 heures k 48mA et k 4°C, puis dialysees plusieurs fois dans un tampon Tris 
HC1 10 mM pH 6.8 avant d'etre reparties en plusieurs parties aliquotes et congelees k - 
10 20°C. Le rendement de la purification est de 1'ordre de 25% avec une purete superieure 
a 90%. 

Protocole 2 : 

Les prolines PS1 et PS2 sont purifies k partir du surnageant de culture de C. 
15 glutamicum ATCC 17965 par ultrafiltration, eiectrophorfcse et transfert sur membrane 
de PVDR 

Les bacteries, cultivees dans le milieu riche LB &34°C, sont recoltdes en phase 
stationnaire de croissance par centrifugation k 8000 g pendant 15 minutes et k 4°C. 4 
ml de surnageant sont dilues 50 fois dans un tampon phosphate 50 mM pH 7.0 avant 

20 d'dtre centrifuges sur une membrane d'ultrafiltration dont ie seuil de coupure est de 30 
kD. Cette etape permet d'obtenir un extrait proteique de 80/j1 qui est ensuite depose 
sur un gel d*eiectrophorfcse compose d'un gel de concentration k 4% et d f un gel de 
separation k 7,5%, L'eiectrophorese est rdalisSe selon le protocole decrit par Laemmli 
avec les modifications suivantes. Toutes les solutions servant k la preparation des gels 

25 ainsi que le tampon de migration sont degazds et contiennent 0,1 M de thioglycolate. 
De plus, le gel de separation est soumis a un "pre-run" avant son utilisation. Toutes 
ces precautions sont prises dans le but d'eviter au maximum la formation de radicaux 
libres qui pourraient conduire k des modifications de Textremite N-terminale des 
prolines et par consequent k un eventuel blocage de cette extremite. A Tissue de 

30 reiectrophorfcse, les proteines sont transferees sur une membrane de PVDF. Cette 
etape se fait dans un tampon 50 mM Tris, 50 mM borate pH 8.0 pendant 60 minutes et 
k 50V. La membrane est ensuite coloree k Tamidoblack, ce qui permet de localiser et 
decouper les bandes correspondant aux proteines PS1 et PS2. Les bandes proteiques 
sont ensuite decolorees et utilisees telles quelles pour le sequen$age N-terminal. 



35 
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{Laemmli, U. K. 1970. Cleavage of structure proteins during assembly of the head of 
bacteriophage T4. Nature, 227 : 680-685. - Lee, C. Levin, A. Branton, D. 1987. 
Copper staining : afive minute protein stain for sodium dodecyl sulfate polyacrylamide 
gels. Anal. Biochom., 166 : 308-312.) 

5 

Rypm plP. 6. Obtention de souehe de Corv nebacterium plutamicum ne 
cynthftisant plus PS t. dite PS1-. fFigure 5). 

La souche C. glutamicum dite Brevibacterium lactofermentum 15 est 

10 permissive a 1' ADN modifie d' E. coli K12 (Bonnassie, S., Oreglia, J., Trautwetter, 
A., and Sicard, A. M. (1990) Isolation and characterization of a restriction and 
modification deficient mutant of Brevibacterium lactofermentum. FEMS Microbiol 
Letters 72: 143-146), alors que la souche C. glutamicum dite C. melassecola~ 
ATCC17965 est une souche tres restrictive vis a vis de 1' ADN d' E. coli (Reyes O., 

15 Guyonvarch, A., Bonamy, C, Saiti, V., David, F., and Leblon, G. (1991) 
'Integron'-bearing vectors: a method suitable for stable chromosomal integration in 
highly restrictive Corynebacteria. Gene 107: 61-68.). Pour cette raison, la souche B. 
lactofermentum 15 a ete choisie pour effectuer I* interruption du gene cspl. II a ete 
venfie que la carte physique du gene cspl est identique chez C. melassecola 

20 ATCC17965 et chez B. lactofermentum 15. 

Le fragment Clal de 1;5 kb du plasmide pAT21 (Trieu-Cuot, P., and 
Courvalin, P. (1983) Nucleotide sequence of the Streptococcus faecalis plasmid gene 
encoding the3'5"-aminoglycoside phosphotransferase type III. Gene 23: 331-341.) 
contenant le gene aphA3 de Streptococcus faecalis, qui confere la resistance a la 

25 kanamycine (KmO, a 6t6 inserd dans le site unique Kpnl (AspllS) du gene cspl 
present dans le plasmide pCGL6l2, pour donner le plasmide pCGL613'. Par Western 
blotting avec des anticorps polyclonaux anti-PSl, il a dte montre que la souche 
recombinante E. coli hebergeant le plasmide pCGL613' est bien de phenotype PS1-. 
Ce plasmide est capable de se repliquer chez E. coU mais pas chez C. glutamicum. II a 

30 et<S introduit dans la souche de C. glutamicum dite A, lactofermentum 15 par electro- 
transformation (Bonamy, C, Guyonvarch, A., Reyes, O., David, R, and Leblon, G. 
(1990) Interspecies electro-transformation in Corynebacteria, FEMS Microbiol Letters 
66: 263-270.) etles transformants Km' ont6te selectionnes. Dans les transformants 
Km*, le plasmide pCGL613' est suppose s' etre intdgrd dans le chromosome de C. 

35 glutamicum par recombinaison homologue avec la region cspl du genome de 1* hote. 
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Dans 22,5% des transformants, un £vfcnement de double crossing-over s' est produit, 
resultant dans la substitution du gfcne cspl sauvage par la construction cspl::aphA3 du 
plasmide transformant, donnant un phenotype Knu-Tets (Figure 5). L' ADN total 
chromosomal de la souche sauvage et d ! un des recombinants Km r-Tet?digere par soit 
5 BgRl soit BamlU et EcoRl a 6i6 analyst par Southern blotting (Sambrook, J., Fritsch, 
E. F M and Maniatis, T. (1989) Molecular cloning: a Laboratory manual, second 
edition. Cold Spring Harbor, New York: Cold Spring Harbor Laboratory 
Publications.) avec la sonde pCGL613*. Le gfene cspl est contenu dans un fragment 
d' approximativement 7,5 kb dans la souche sauvage, alors que l 1 integrant 

10 pCGL613' contient un fragment d' approximativement 9 kb correspondant au gfcne 
aphA3 de 1, 5 kb insert dans le gfcne cspl. La digestion BamHl-EcoRl confirme la 
structure de l f integrant presentee dans la figure 5. 

L ! integrant Km'-Tei? a egalement 616 analyst par Western blotting pour la* 
production de PS1 en utilisant des anticorps polyclonaux anti-PS 1. II n' y a pas de 

15 proline PS1, ni dans le sumageant de culture, ni dans 1' extrait brut de cette souche. 
Ceci confirme que le gfene cspl clon£ dans Xgtl 1 correspond k un gfene unique qui 
code bien pour PS1 dans C. glutamicunu 

Cette souche C. glutamicum PS1- est tout k fait viable et ne semble pas 
affectee dans son taux de croissance. Ce resultat montre qu' tl est possible d' utiliser la 

20 region du gfene cspl comme cible d 1 integration d* ADN homologue ou h£t£rologue 
dans une souche de C. glutamicum, sans en affecter, a priori, la viability 
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F.vemple 7. Evpressfon ehez C. plutamicum du gene cspl en 
multicopies. Analyse des Sci ons importantes de PS1, necessaires a sa 
svnthese et a sa secretion. 

5 Pour cette serie d' experiences, le plasmide pCGL616 a ete construit. II 

contient P integralite du gene cspl et a &£ construit a partir du plasmide pCGL125, 
correspondant au plasmide pBLl (Santamaria, R., Gil, J. A., Mesas, J- M. and J. F. 
Martin (1984) Characterization of an endogenous plasmid and development of cloning 
vectors and a transformation system in Brevibacterium lactofermentum. J. Gen. 
10 Microbiol. 130: 2237-2246.), replicatif chez C. glutamicum, dote d' une cassette de 
clonage comportant le gene aphA3 de Streptococcus faecalis et du plasmide 
pCSPIG, replicatif chez £. coli, contenant le gene cspl. Le plasmide, pCGL616, 
resultant de cette construction (Figure 6) est replicatif chez C. glutamicum. 

IS Restauration de la synthese de PS1 dans une souche de C. 

glutamicum PS1-. 

On observe la restauration dans la souche dite, B. lactofermentum 15 PS1-, de 
la synthese de PS 1, apres introduction dans celle-ci du plasmide pCGL616. Dans cette 
souche B. lactofermentum 15 PS1- hebergeant le plasmide pCGL616, une quantity 
20 plus importante de PS1 secretee est detected en comparaison de la souche sauvage B. 
lactofermentum 15 (naturellement PS1+). Ceci signifie qu' tl est possible d' 
augmenter la concentration de PS1 secrftee dans une souche de C. glutamicum en 
augmentant le nombre de copies du gene cspl. 

Ce rdsultat est egalement d6montr6 dans la souche dite C. melassecola 

25 ATCC17965. 

Constructions de plasmides derives de pCGL616 permettant la 
synthese de proteines PS1 tronquees. (Figure 7). 

Cette experience montre qu' une proteme PS1 tronqute d' une masse 
30 moleculaire alors 6gale a environ 23000 (Mw), au lieu de 67000 (Mw) pour la 
proline naturelle, peut encore etre secretee chez C. glutamicum. 

Sept deletions ont ete effectuees dans la region du gene cspl donnant 
naissance a sept plasmides differents, a partir du plasmide pCGL616. Toutes ces 
deletions conservent la region de r ADN equivalente a la sequence signal de PS1 ainsi 
35 que le terminateur de transcription du gene cspl. Dans tous les cas la synthese et la 
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s^crdtion de la proline PS1 tronquee a 6te analyst par Western blotting avec les 
anticorps polyclonaux anti-PS L Ces resultats montrent qu f il est possible de deleter 
une grande partie du gfcne cspl (figure 7) tout en rendant encore possible la synthase 
et la secretion d ! une proline PS1 tronquee. La plus grande d£16tion permettant ce 
5 r&ultat correspond k la deletion du fragment Ncol-BspEX {BspMll) d* environ 1,3 kb 
du g£ne cspl (pCGL1041) donnant une taille de proteine precurseur pour PS1 egale k 
environ 29 kD et k environ 24kD pour la forme mature secretde. Dans le surnageant de 
culture de la souche dite B. lactofermentum 15 PS1- h^bergeant ce plasmide 
pCGL1041, il est bien d&ecte par Western blotting avec les anticorps anti-PS 1 une 
10 proteine d' environ 23 kD. 

Exemole 8. Construction d 1 un vecteur d 1 expression et de secretion 
chez C. glutamicum nomme pCGL1030 base sur le systeme cspl: 
(Figure 8. 9, 10. 11) 

15 

Conduction du plasmide pCGL1030 (Figure 8). 

Ce plasmide rdplicatif chez C. glutamicum (contient le plasmide pBLl de C. 
glutamicum) porte le promoteur du gfcne cspl de C. glutamicum et la region d' ADN 
de ce gene correspondant k la sequence signal plus ies 30 premiers acides amines de la 
20 sequence mature de PS1. Un site mutiple de clonage (polylinker 2 dans la figure 8) a 
ete plac£ imm&iiatement derrifere le 30 >«nc acide amin£ de la sequence mature de PS 1 , 
afin de permettre le clonage aise en phase de tout gfcne h£t6rologue devant §tre exprim6 
chez C. glutamicum. Enfm, ce plasmide est dote des 61dments de PS1 n&essaires k la 
secretion et correspond done k un outil et d 1 expression et de secretion. 

25 

Expression du gene eel A de Clostridium thermocellum chez 
Corynebacterium glutamicum et secretion de la proteine correspondante 
(Figure 9). 

Le gfcne celA de C. thermocellum, (Cornet, P., Millet, J M B£guin, P. and J.-R 
30 Aubert ( 1983) Characterization of two eel (cellulose degradation) genes of Clostridium 
thermocellum coding for endoglucanases. Bio/Technology 1:589-594.) codant pour 
une endoglucanase nomm€e endoglucanase A ou EGA, a 6l6 clon6 dans le vecteur 
pCGL1030 au site Sma I, donnant naissance au plasmide pCGL1031(Figure 9). Ce 
gfene celA provient du plasmide pCGL1008 oh un site de restriction BstXl a 6te 
35 introduit artificiellement, trfes prfes du site de d^marrage de traduction de la proteine 
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EGA, a des fins de constructions chimeres (voir Figure 10, 11). La synthese de ia 
proline EGA est facilement detectable grSce a un test colors d' activite enzymatique 
sur boite utilisant un substrat des endoglucanases, la carboxymethylcellulose dite 
CMC (Cornet, P., Millet, J., Beguin, P. and J.-P. Aubert (1983) Characterization of 
5 two eel (cellulose degradation) genes of Clostridium thermocellum coding for 
endoglucanases. Bio/Technology 1:589-594.). Ce test CMC sera utilise pour 
confirmer la synthese de la proteine EGA de C. thermocellum chez C. glutamicum. 
Un test CMC d'activite" sur boite effectue sur des cellules entieres ou sur le sumageant 
de culture, en milieu riche (LB -Luria Broth- ou BHI -Brain Heart Infusion-) met en 

10 evidence dans les deux cas, I' activite" endoglucanase d' une souche de C. glutamicum 
dite Brevibacterium lactofermetuum 15 hebergeant le plasmide pCGL103 1. On notera 
une activite" plus forte sur milieu LB + fructose, ou + glucose, indiquant un effet 
stimulant de ces deux sucres sur 1' expression de celA sous controle du promoteur 
cspl. Ceci se confirme dans le zymogramme (Beguin, P. (1983) Detection of 

15 cellulase activity in polyacrylamide gels using Congo red stained agar replicas Anal. 
Biochem. 131: 333-336.), et dans le Western blotting realist sur les sumageants de 
culture avec des anticorps polyclonaux anti-EGA. 

Utilisation du systeme cspl pour 1' expression et la secretion du 
20 polypeptide synthltique (AQK)10 (Figure 10). 

Un gene synthetfque correspondant au polypeptide alanine-glutamine-lysine 
repete" 10 fois a €t€ synth&isS chimiquement et clone" au site BsiXl du plasmide 
pCGL1008, donnant naissance au plasmide pCGL1017. Le fragment £coRI du 
plasmide pCGL1017 aete clone au site Smal du plasmide pCGL1030, situe en aval 
25 du promoteur cspl de Ia sequence signal et des 30 premiers acides amines de PS1 (et 
en amont du gene reporter celA), donnant naissance au plasmide pCGL1032 (Figure 
10). La detection de la proteme chimere PSl-(AQK)10-EGA est effectuee comme 
decrit ci-dessus, par test CMC sur boite par zymogramme ou par Western blotting. 

30 Utilisation du systeme cspl pour 1" expression et la secretion du 
polypeptide synthetique (AQ)19 (Figure 11). 

Un gene synthetique correspondant au polypeptide alanine-glutamine repet<5 20 
fois a ete synthe"tise" chimiquement et clone au site BsiXl du plasmide pCGL1008, 
donnant naissance au plasmide pCGLlOOl Le fragment EcoKl du plasmide 

35 pCGL1002 aete clon6 au siteSmal du plasmide PCGL1030, situ6 en aval du 
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promoteur cspl de la sequence signal et des 30 premiers acides amines de PS1 (et en 
amont du gfcne reporter celA), donnant naissance au plasmide pCGL1033 (Figure 
11). La detection de la proteine chimfere PS1-(AQ)19-EGA est effectuee comme decrit 
ci-dessus, par test CMC sur boite, par zymogramme ou par Western blotting. La 
5 sequence chez B. lactofermentum dans le plasmide pCGL1033 a fait apparaitre la perte 
d'une sequence codante AQ (passage de AQ20 * AQ19 lors du clonage chez EL 
lactofermentum) . 

Cette serie d 1 experiences montre que le promoteur du gfene cspl permet P 

10 expression chez C. glutamicum du gene heterologue celA de Clostridium 
tfiermocellum et des constructions chimfcres (AQK) 10 -celA et (AQ)19 <elA. De plus, 
ces experiences montrent que les elements de PS1, en I'occurrence, sa sequence signal 
suivie des 30 premiers acides amines de sa sequence mature places en amont des- 
g6nes heterologues, permettent la secretion des produits correspondants. L 1 effet du 

15 milieu de culture et de V adjonction ou non de sucre dans ce milieu, en ^occurrence de 
glucose ou de fructose, a un effet sur la production du produit correspondant. En 
particulier, sous le controle du promoteur de cspl et chez C. glutamicum, la 
production d f EGA ou des prolines chimfcres (AQK)10-EGA ou (AQ)19-EGA, est 
meilleure sur milieu LB que sur milieu BHI, elle est fortement stimulee par le glucose 

20 ou le fructose sur milieu LB. Le promoteur cspl de C glutamicum semble plus fort 
que le promoteur naturel de celAdt C. thermocellum\ en effet la souche dite B. 
lactofermentum 15 hebergeant le plasmide pCGL602, qui contient le promoteur 
naturel de celA pr&ente une activite endoglucanase nettement moins importante que 
cette m6me souche hebergeant le plasmide pCGL1031, oil celA est sous le controle du 

25 promoteur cspl de C. glutamicum. 

V experience de Western blotting realisee sur les surnageants de culture de 
differentes souches contenant pCGL1032 ou pCGL1033 montre que plusieurs bandes 
proteiques reagissent avec des anticorps polyclonaux anti-EGA. Ces differentes 
bandes sont specifiques de 1* endoglucanase EGA (absentes du temoin) et 

30 correspondent vraisemblablement k des produits de degradation de la proteine et des 
proteines chimfcres. Cependant des bandes de plus hautes masses moieculaires sont 
bien observes avec (AQK)10-EGA (pCGL1032) et (AQ)19-EGA (pCGL1033) et de 
fa$on coherente (Mw (AQ)19-EGA> Mw ( AQK) 10-EGA). 
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i?v»m piP 0. Sequence nucleotid ioue du gene csd2 codant pour la 
groteine PS2 de Cnrvnebacterium elu tamicum (F»<nirg 12. 13). 

Le sequencage d' un fragment de 2702 paires de base contenant le gene codant 

5 pour PS2, nomine csp2, et de la region en amont a 6t6 realist. La sequence 
nucleotidique est presented dans la figure 12 (sequence ID n a 2). La figure 13 
represente la carte de restriction de cette region sequenced 

Par analyse informatique, une phase ouverte de lecture de 1532 paires de base 
a 6t6 identified correspondant a 510 acides amines. 

10 Une sequence de type Shine Dalgamo a 6t6 identified, AAGGAG, juste en 

amont du codon de demarrage de la traduction (-12 a -17). 

A 1' extremity NH2 de la proteme se trouve une sequence signal tout a fait 
banale de bactene de type Gram-positive de 30 acides amines. Une sequence d' acides- 
amines, ile pro ala phe ala, putative d' un site de ciivage de sequence signal a 6t£ 

15 trouved. La determination de la sequence amino-terminale de la proteme par la 
technique de de-gradation d' Edman, purified a partir du surnageant de culture de 
Corynebacterium glutamicum, n' a donn<S aucun signal bien que 5 nmoles de proteme 
purified ait e"te" utilised. Comme deux protocoles de purification ont 6l6 utilises, il est 
probable que la proteine PS2 soit bloqued in vivo , tout comme PS 1, et que le blocage 

20 ne soit pas une consequence de la technique de purification utilised La sequence 
signal proposed de 30 acides amines fait apparaitre une glutamine (position 31) comme 
premier acide amine" de la sequence mature, facilement convertie en acide 
pyroglutamique rendant impossible le sequencage amino-terminal de la proteme par la 
technique d' Edman. Cette proline PS2 possede les caractenstiques des protemes de 

25 paroi, comme son caractere tres acide (pl=4,l), son absence de r&idus cysteine et son 
tres faible contenu en residus methionine (Sleytr, U. B. (1978) Regular arrays of 
macromoleculeson bacterial cell walls: structure, chemistry, assembly, and function. 
Int Rev. Cytol. 53: 1-64.) (Sleytr, U. B. and P. Messner (1983) Crystalline surface 
layers on bacteria. Ann. Rev. Microbiol. 37: 311-339.). Les analyses de microscopie 

30 dectronique confirme que PS2 est bien une proteme de paroi capable de s« arranger en 
structure hexagonale ordonnee a la surface cellulaire. 

Un site putatif de terminateur de type rho independant est trouve dans la region 
3' du gene a 76 nucleotides du codon stop. 

Les caractenstiques de la sequence sont les suivants: 
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de 562 k 567: site de fixation aux ribosomes 

de 579 k 2108: sequence codante 

de 579 k 668: sequence signal de proteine sdcretee 

de 2188 k 2233: structure en epingle a cheveux, signal putatif de terminaison de 
5 transcription de type rho independant (present k 76 nucleotides du codon stop). 

Exemple 10, Obtention de souche de Corvnebacterium glutamicum ne 
svnthetisant plus PS2. dite PS2-. (Figure 14). 

10 L'interruption du gfcne csp2 a 6l6 r£alisee chez C. glutamicum dite B. 

lactofermentwn 15 k l'aide du vecteur pCGL830 (Figure 14), vecteur non repiicatif 
chez les corynebacteries, et portant une copie du gene csp2 inactive par Tinsertion du 
gene aphlll (clonage du gene aphlll au site unique Nru I de csp2 porte par le* 
plasmide pCGL811). Aucun signal de PS2 n'a €t€ mis en Evidence par detection 

15 immunologique avec des anticorps polyclonaux anti-PS2, sur des extraits cellulaires 
issus de la souche £. colilQl portant le plasmide pCGL830. Par dlectroporation de 
la souche B. lactofermentum 15 et selection sur Km, des clones integres ont 6t6 
sdlectionn^s. Parmi ces integrants, les clones Tets ont 6t6 obtenus indiquant un 
evfcnement de double crossing-over conduisant k la substitution du gfene sauvage par le 

20 gfcne interrompu. 

L ! analyse par southern blot de I'ADN chromosomique diger£ par Xho I et Sac 
I des clones Km' Tets en utilisant la sonde pCGL811 montre respectivement un 
fragment k 4,2kb et 2,2kb au lieu de 2,7kb pour Xho I et de 0,7kb Sac I obtenu pour 
la souche sauvage, indiquant une augmentation de taille lide k la presence du gene 

25 aphin . 

L'absence de detection de PS2 par Western blotting, avec des anticorps 
polyclonaux anti-PS2, dans les differentes fractions confirme 1' interruption du gfcne 
csp2 dans B. lactofermentum. Cette souche PS2- est tout k fait viable et n 1 est affect£e 
en rien dans sa croissance. De meme que la region du chromosome de C. glutamicum 
30 portant le gfcne cspl, cette region d' ADN portant le gfene csp2 , peut 6tre ggalement 
utilis^e comme cible d f integration d ! ADN Granger sans affecter la croissance de la 
bact&ie. 
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Restaurati n du phen type PS2+ dans la souche B. lactofermentumlS 
PS2-. 

Le fragment Scal-Fspl de 23 kb contenant 1' integrality du gene csp2 ainsi que 
la region d' ADN en amont, a ete sous-clone dans le plasmide pCGL824 et reintroduit 
5 dans la souche B. lactofermentum 15 PS2-, permettant la restauration du phenotype 
PS2 +. II est a noter qu' une plus grande quantity de PS2 est obtenue lorsque le gene 
est en multicopies. Ces rdsultats montrent que la quantity de produit secrete issu du 
gene csp2 de C. glutamicum peut etre modified en fonction du nombre de copies du 
gene. 

10 Une analyse en microscopie eiectronique d' un echantillon des souches PS2+ 

et PS2- (obtenue par la technique enoncee ci-dessus) par cryofracture montre Vchs 
clairement que la proteine PS2 est effectivement une proline de paroi capable de s' 
arranger en structure hexagonale ordonnee a la surface cellulaire. 

15 F.vemnle 11. Effet de la temperatu re sur la secretion de PS1. (Figure 
15Y. 

Les bacteries en phase exponentielle de croissance (34°C) ont ete marquees par 
la methionine 3*S durant I mn. Du chloramphenicol (100/<g/ml) et un exces de 

20 methionine froide (32S) sont alors ajoutes (temps 0). La temperature de la suspension 
cellulaire est alors rapidement portee a la temperature desiree et 1' incubation est 
continued a la dite temperature pendant 30 mn. La translocation de PS 1 est determinee 
par SDS-PAGE, autoradiographic et quanttfiee par densitometrie (Figure 15). La 
translocation de PS1 est clairement dependante de la temperature. Aucune 

25 translocation n' a lieu au-dessous de 10°C, elle augmente rapidement au-dessus de 
cette temperature pour atteindre un maximum autour de 30°C. La translocation est 
coneiee a une transition de phase des lipides (figure 15). 
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Egemnle 12. Construction d'une banque d'ADN chromosomique 
de Corvnehacterium melassecola ATCC 17965 et clonage du gene 
gdhA 

5 L'ADN chromosomique de la souche de C. melassecola ATCC 17965 a 

ete prepare suivant la methode decrite par Ausubel FM, Brent R, Kingston 
RE, Moore DD, Seidman JG, Smith JA, Struhl K (Eds) ((1987) Current 
protocols in Molecular Biology. John Wiley and Sons, New York). Une 
digestion menagee par i'endonuclease de restriction Mbo I ( Boehringer ) 

10 a ete realisee sur 10 *ig de cet ADN en suivant le protocole decrit par 
Maniatis T, Fritsch EF, Sambrook J ((1982) Molecular cloning : a laboratory 
manual. Cold Spring Harbor Laboratory Press, Cold Spring Harbor, New 
York). Les fragments d'ADN ont ete separes en fonction de leur taille sur. 
gradient de sucrose comme decrit par Ausubel et al. (1987). Les fragments 

15 d'une taille comprise entre 6 et 15 kb ont ete retenus pour la construction 
de la banque. 

Le plasmide de clonage pUN121 (Nilsson B, Uhlen M, Josephson S, 
Gatenberg S, Philipson L (1983) An improved positive selection plasmid 
vector constructed by oligonucleotide mediated mutagenesis. Nucleic Acids 

20 Res 11 : 8019-8030) a ete prepare par la methode de Birnboim HC, Doly J 
((1979) A rapid alkaline extraction procedure for screening recombinant 
plasmid DNA. Nucleic Acids Res 7 : 1513-1523), a partir de la souche de E 
coli GM 2929 disponible librement aupres du Dr. B. Bachmann. Le plasmide 
a ete linearise par I'endonuclease de restriction Bel I ( Boehringer ). 

25 La banque a ete construite par ligation avec la T4 DNA ligase 

(Boehringer) dans les conditions decrites par Ausubel et aL (1987), de 1 *ig 
de plasmide pUN121 linearise par Bel I et de 2 ng des fragments d'ADN de 6 
a 15 kb decrits ci-dessus. Le melange de ligation a et6 introduit dans la 
souche de E coli DH5 par electroporation en suivant le protocole decrit 

30 par Dower WJ, Miller JF, Ragsdaie CW ((1988) High efficiency 
transformation of E coli by high voltage electroporation. Nucleic Acids 
Res 16 : 6127-6145). Les clones de E coli portant les plasmides 
recombinants ont ete selectionnes directement par leur capacite a croitre 
sur milieu LB contenant 10 jig/ml de tetracycline. Les plasmides de la 

35 totality des clones r6sistants a la tetracycline ont ete prepares par la 
methode de Birnboim et Doly ( 1979 ). L'ensemble de ces plasmides 
correspond a la banque d'ADN. 
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La souche de E coli CLR207 recA (Mattaj IW, McPherson MJ, Wooton 
JC (1982) Localization of a strongly conserved section of coding sequence 
in glutamate dehydrogenase genes. FEBS Letters 147 : 21-25), deficiente 
pour l'activite glutamate dehydrogenase a ete transformee avec la banque 
5 d'ADN de C melassecola ATCC 1 7965. Un clone transformant de E_£pji CLR 
207 recA capable de croitre sur milieu minimum de selection contenant 
100 ng/ml d'ampicilline a ete selectionne. Ce clone est porteur d'un 
plasmide recombinant, pCGL310. L'activite glutamate deshydrogenase 
mesuree suivant la methode de Meers JL, Tempest DW, Brown CM ((1970) 

10 Glutamine (amide) : 2-oxoglutarate amino transferase oxido-reductase 
(NADP), an enzyme involved in the synthesis of glutamate by some 
bacteria. J Gen Microbiol 64 : 187-194), est restoree dans la souche de £_ 
coli CLR207 £g£A porteuse du plasmide pCGL310. Differents sous-clonages- 
ont permis dans un premier temps de raccourcir le fragment d'ADN de C 

15 melassecola portant le gene gdhA complet a un fragment d'ADN de 3,8 kb 
delimite par les sites de restriction Eco RI et XM I. Une carte de restriction 
precise de ce fragment Eco. RI - Xho I est presentee Fig 16. Des sous- 
clonages supplementaires ont permis de delimiter plus precisement le 
gene gdh A a un fragment Nlie I - Bgl I de 2,2 kb. Une hybridation ADN- 

20 ADN par la methode de Southern EM ((1975) Detection of specific 
sequences among DNA fragments separated by gel electrophoresis. J Mol 
Biol 98 : 503-517), a montre que le fragment d'ADN clone est bien issu de la 
souche de r. melassecola ATCC 17965. 

25 D6tennination de la sequence nucleotidique du gene £dji A. 

Afin de proceder a la determination de la sequence nucleotidique du 
fragment d'ADN £cj2. RI - Xfco I mentionne ci-devant, les sous-clonages 
suivants ont et£ effectues :(1) ££P_ RI - Bgl II dans le vecteur M13 mpl8 
(Norrander J, Kempe T, Messing J (1983) Construction of improved Ml 3 

30 vectors using oligodeoxy-nudeotide directed mutagenesis. Nucleic Acids 
Res 26 : 101-106) coupe par Eco RI - Bani HI, (2) JCba I - Est I dans le 
vecteur M13 mpl8 coupe par Xba I - Pst I , (3) Xho I - M II dans le vecteur 
M13 mpl8 coupe par Sal I - Bam. HI, (4) Eco RI - Pst I dans le vecteur M13 
mpl9 (Norrander et al. , 1983) coupe par Eco RI - Est I. De la sorte, la 

35 sequence nucleotidique complete du fragment f£2 RI - Xfea I contenu dans 
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le fragment Eco RI - Xho I a pu etre determinee sur les deux brins par la 
methode de Sanger F, Nicklen S, Coulson AR ((1977) DNA sequencing with 
chain terminating inhibitors. Proc Natl Acad Sci USA 74 : 5463-5467). La 
sequence complete du fragment Nhe I - Bgl I contenant le gene gdh A est 
5 presentee Fig 17 (sequence ID n° 3). 

Analyse de la sequence nucleotidique du gene gdh A 

I/analyse de la sequence nucleotidique du fragment Nhe I - Bgl I 
permet de mettre en evidence les elements suivants : 

a) promoteur ( nucleotides 1 a 572 ) 

10 Le promoteur du gene gdh A peut etre caracterise en ce qu'il 

comprend les elements structured suivants : 
_ nucleotides 251 k 266 

signal TGGTCATATCTGTGCG presentant une similitude avec la- 
sequenceTGG(Py)A(Pu)NNNNTTGCA caracteristique des promoteurs 

15 reconnus par le facteur o60 (Merrick MJ (1983) Nitrogen control of the 
nif regulon in Klebsiella pneumoniae : involvement of the nt£ A gene and 
analogies between ntr C and nif A. EMBO J 2 : 39-44) et regules par 
Tammonium. 
_ nucleotides 437 a 442 

20 signal TTCACA presentant une similitude avec la sequence TTGAC(Pu) 
caracteristique de la zone -35 des promoteurs de Streptomvces sp. (Strohl 
WR ((1992) Compilation and analysis of DNA sequences associated with 
apparent streptomycete promoters. Nucleic Acids Res 20 : 961-974) 
_ nucleotides 466 a 471 

25 signal TAGGAT presentant une similitude avec la sequence TAG(Pu)(Pu)T 
caracteristique de la zone -10 des promoteurs de Streptomvces sp. ( Strohl, 
1992) 

_ nucleotides 558 k 572 

signal GGGAACGAGGAAATC presentant une similitude avec la sequence 
30 AAAGGAGGTGATC de fixation du ribosome chez Streptomvces sp. ( Strohl, 
1992) 

b) sequence codante ( nucleotides 573 k 1913 ) 

La phase de lecture s'etendant de la position 573 a 1913 correspond a 
celie de la glutamate deshydrogenase en raison des donnees suivantes : 

35 
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_ La proteine deduite de cette phase de lecture comporte 447 acides 
amines, avec un poids moleculaire predit de 48957 Daltons. Ce poids 
moleculaire est tres proche de celui du polypeptide ( 48300 D) observe 
apres electrophorese en gel denaturant d'une preparation de glutamate 
5 deshydrogenase de la souche de Cmelassecola ATCC 17965. 

_ La structure primaire de la glutamate deshydrogenase deduite de 
la sequence nucleotidique du gene gdh. A de C. melassecola presente de 
fortes similarites avec les structures primaires de glutamate 
deshydrogenases d'autres organismes (Teller JK, Smith Rj, McPherson MJ, 
10 Engel PC, Guest JR ((1992) The glutamate dehydrogenase gene of 
rinstridium svmbiosum : cloning by polymerase chain reaction, sequence 
analysis and over-expression in Escherichia coli. Eur J Biochem 206 : 151- 
159). 

Les acides amines mentionnes par Baker PJ, Britton KL, Engel PC, 
15 Farrants GW, Lilley KS, Rice DW, Stillman TJ ((1992) Subunit assembly and 
active site location in the structure of glutamate dehydrogenase. Proteins 
12 : 75-86) comme etant indispensables a 1'activite glutamate 
deshydrogenase sont presents dans la glutamate deshydrogenase de 
melassecola , et ce a des positions equivalentes a celles decrites par Baker 

20 etaL(l992). 

La structure secondaire de la glutamate deshydrogenase de C 
melassecola. deduite de la sequence primaire mentionnee ci-dessus, 
presente de fortes similarites avec les structures secondares de glutamate 
deshydrogenases d'autres organismes ( Teller et al. , 1992 ). 

25 c) terminateur ( nucleotides 1937 a 1977 ) 

Le terminateur du gene gdh A peut etre caracterise en ce qu'il 
comprend 1* element structurel suivant : 

_ sequence CCCTGATCCGCGTTAAGGATCAGGG pouvant former une 
structure en epingle a cheveux riche en appariements GC avec un AG - - 

30 13,6 kcal / mole, suivie de la sequence TTATTTGATTTCTT riche en T. Une 
telle structure est caracteristique des terminateurs rho-independants 
(Rosenberg M, Court D (1979) Regulatory sequences involved in the 
promotion and termination of RNA transcription. Ann Rev Genet 13 : 319- 
353). 
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Regulation de Texpression du gene qdh A de C. melassecola 

La regulation de 1'expression du gene gdh A de C. melassecola ATCC 
17965 a ete etudiee par mesure des variations de 1'activite specifique 
glutamate deshydrogenase en fonction de la nature du milieu dans lequel 
5 cette souche a ete cuitivee. L'activite glutamate deshydrogenase a ete 
mesuree par la methode de Meers et al. (1970) a partir d'extraits 
acellulaires de C. melassecola obtenus par uitrasonication. 

Les milieux de culture utilises pour cette etude sont des milieux 
synthetiques dont la base est celle decrite par Liebl W, Klamer R, Schleifer 
10 KH (1989) (Requirement of chelating compounds for the growth of 
Corynebacterium glutamicum in synthetic media. Appl Microbiol 
Biotechnol 32 : 205-210). Les modifications suivantes ont ete apportees : 

_ La source de carbone est soit du glucose all g/1 final ( milieux 1 , 
2 et 4 ) soit du fructose a 10 g/1 (milieu 3 ). 
15 _ La concentration en ions NH4+ est de 125 raM dans les milieux 1 , 3 

et 4. Elle est de 1,25 mM dans le milieu 2 ( limitation en NH4+ ). 

_ Le milieu 4 contient 50 g/1 final de L-glutamate. 

Les activites specifiques mesurees pour la glutamate 
deshydrogenase de la souche C. melassecola ATCC 17965 cuitivee dans les 
20 differents milieux decrits ci-dessus sont donnees dans le tableau ci- 
dessous. Les activites sont exprimees en micromoles de NADPH2 
transformees par minute et par milligramme de proteines. 

milieu milieu 1 milieu 2 milieu 3 milieu 4 

25 Act. specifique GdhA 4,4 +/- 0,3 23,2 +A 1,1 18,2 +/- 1,8 2,8 +/- 0,2 

Ce tableau permet de mettre en evidence les trois types suivants de 
regulation de 1'expression du gene gdh A de C. melassecola ATCC 17965. 

_ repression de 1'expression par le glutamate ( facteur 1,57 ) 
30 _ repression de Texpression par i'exces d'ammonium ( facteur 5,27 ) 

_ repression catabolique par le glucose ( facteur 4,13 entre fructose 
et glucose ). II faut noter que dans le cas de la repression catabolique, les 
activites enzymatiques isocitrate deshydrogenase, aconitase, citrate 
synthase sont egalement touchees. 
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Construction d'un vecteur de fusion gdh A - lac Z 

Afin de contrdler chez C. melassecola le caractere transcriptionnel 
de la regulation du gene gdli A par le glutamate, l'exces d'ammonium et le 
glucose, et de disposer d'un outil pennettant une selection simple de 
5 mutants de r, melassecola non soumis a ces regulations, une construction a 
ete realisee entre le promoteur et le codon ATG d'initiation de la traduction 
du gene gdh A et l'operon lac d' E coli delete au niveau du gene IgcZ de ses 
cinq premiers acides amines. Cette fusion a ete realisee comme suit : 

_ Isolement d'un fragment Eco RI - Bsp. HI contenant le promoteur 

10 du gene gdh A. 

_ Conversion de l'extremite B§£ HI en extremite franche. 
_ Clonage du fragment ainsi obtenu dans le vecteur pMC 1403 
(Casadaban MJ. Chou J, Cohen SN ( 1980) In vitro gene fusions that join an. 
enzymatically actice p-galactosidase segment to aniino-terminal fragments 

15 of exogenous proteins : Escherichia coli plasmid vectors for the detection 
and cloning of translational initiation signals. J Bacteriol 143 : 971-980) 
linearise par Eco. RI et Sma I, donnant naissance au plasmide pCGL 133. 

_ Isolement du fragment Nhe I - §al I de pCGL 133 contenant la 
fusion promoteur gdh A - operon lac decrite ci-dessus et clonage dans le 

20 vecteur pCGL 241 (Reyes O, Guyonvarch A, Bonamy C, Salti V, David F, 
Leblon G (1991) "Integron" bearing vectors : a method suitable for stable 
chromosomal integration in highly restrictive Corynebacteria. Gene 107 : 
61-68) linearise par See I et £§1 I, donnant ainsi naissance au plasmide 
pCGL 140 (figure 18). 

25 _ Transfert de l'integron isole de pCGL 140, contenant la fusion 

g dhA - lac. ainsi que le gene afih. ffl conferant la resistance a la 
kanamycine, dans le vecteur pCGL 125, donnant naissance a pCGL 141 et 
pCGL 142 ( Hg. 18 ). Les plasmides pCGL 141 et pCGL 142 ont ete introduits 
danslasoucheCmelasseeolaATCC 17965 par transformation. 

30 La fonctionalite de la fusion gdjL A - lac. a ete montree par mise en 
evidence d'une activite p-galactosidase dans les souches de C. melassecola 
ATCC 17965 transformees par pCGL 141 et pCGL142, activite absente de la 
meme souche transfonnee par pCGL 125. L'activite p-galactosidase est mise 
en evidence par culture des bacteries sur milieu complet solidifie (BHI, 

35 Difco ) contenant le substrat chromogene X-gal ( 5-bromo-4-chloro-3- 
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indolyl p-D-galactopyranoside ). Les colonies issues de bacteries possedant 
l'activite p-galactosidase deviennent bleues sur un tel milieu. Par culture 
des bacteries transformees par pCGL 141 et pCGL 142 sur les milieux 1, 2, 3 
et 4 decrits ci-dessus, solidifies par adjonction d'agar a 15 g/1 final, et 
5 supplements par de la kanamycine a 25 mg/1 final et du X-Gal a 100 mg/1 
final, nous avons pu montrer que la regulation du gene gdh A est bien de 
type transcriptional puisque les colonies bacteriennes obtenues sur ces 
differents milieux presentent un gradient de coloration compatible avec la 
regulation montree par mesure enzymatique. En effet, les colonies 

10 obtenues sur milieu 4, sont d T un bleu plus clair que celles obtenues , dans 
Tordre d'intensite croissante, sur les milieux 1, 3 et 2. 
Nous avons montre que cette difference se refletait au niveau de la mesure 
enzymatique de l'activite p-galactosidase pour des cultures de C. 
melassecola transformee par pCGL 141 en milieu 1 et milieu 4 ( repression 

15 par le glutamate ). 

milieu milieu 1 milieu 4 

Act sp. p-gal. 0,118 0,052 

20 Les activites p-galactosidase ont 6te mesurees comme decrit par 

Miller JH (1972) (Experiments in molecular genetics. Cold Spring Harbor 
Laboratory Press, Cold Spring Harbor, New York), a partir d'extraits 
acellulaires de C melassecola, 

25 Selection de mutants deficients en repression catabolique 

Une mutagenese NTG d'une souche d^rivee de C. melassecola 
ATCC 17965 a 6te realisee, A partir de cette mutagenese, une premiere 
selection a 6t6 appliqu^e sur le critere de resistance a un analogue du 
glutamate, le 4-fluoroglutamate. Les mutants r6sistants a cet analogue 

30 peuvent appartenir a differentes classes dont la classe de non repression 
catabolique. En effet, dans de tels mutants, on peut s'attendre a ce que 
Pelevation d'activite specifique de la glutamate deshydrogenase conduise a 
une surproduction de glutamate intracellulaire, et ainsi ci une dilution de 
i'analogue toxique, d'ou le phenomene de resistance. Les mutants de 
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resistance au 4-fluoroglutamate ont £te rassembles et l'ensemble des 
cellules a et£ soumis a transformation par pCGL 141. Les bacteries 
transformees ont et6 etalees sur milieu 1 solidifiS contenant du X-Gal et de 
la kanamycine. Les colonies bactenennes presentant la couleur bleue la 
5 plus intense ont 6te isolees, et mises en culture en milieu 1 liquide 
contenant de la kanamycine. L* activite glutamate deshydrogenase a ete 
mesuree a partir d'un extrait acellulaire, l'activite p-galactosidase a partir 
de cellules entieres toluenisees ( Miller, 1972 ). Les resultats obtenus pour 
Tun des mutants selectionnes sont pr^sentes ci-dessous. 

10 

activite glutamate deshydrogenase p-galactosidase 
temoin 6,3 # 10,79 

mutant 90 12,1 23,66 

15 Les resultats obtenus montrent done bien qu'il est possible de 

selectionner par crible ph^notypique des mutants de regulation du gene 
gdh A avec l'outil construit. II faut noter qu'il est tres ais6 d'eliminer pCGL 
141 et pCGL 142 des cellules apres selection, simplement par culture en 
absence de pression de selection kanamycine. 
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Exemple 13. Construction d' un plasmide permettant le clonage de peptides 
Pour cette construction, une etape de sous-cionage de celA a 
ete realisee. Le gene ceiA disponible sous forme d'un fragment Hind lH de 
3,5kb contenant la region promotrice, le gene et le debut d'un autre gene 
5 non identifie, a ete sous-clone sous forme d'un fragment Hind HI-EcoRl de 
2,6kb delete du morceau de gene inconnu, dans un vecteur replicatif 
d'E^coli, le pMTL23 (Chambers, S.P., Prior, S.E„ Barstow, D.A. and Minton 
N.P. (1988) The pMTL nic - cloning vectors. I. Improved pUC polylinker 
regions to facilitate the use of sonicated DNA for nucleotide sequencing. 
10 Gene. 68: 139-1*9.) 

Le site EcoRI a ete introduit par mutagenese dirigee 
immediatement derriere le terminateur de transcription du gene. Ce 
sous-clonage intermediate, compte tenu des sites de restriction introduits 
est necessaire a l'etape suivante de clonage ; en particulier le clonage dans 
15 le polylinker de pMTL23 permet Introduction d'un site de restriction Ncol 
juste derriere le site EcoRI, ce qui permet de sortir le fragment contenant 
la region codante de celA sous forme d'un fragment Nael-Ncol. Cette etape 
permet egalement de disposer d'un gene celA depourvu de sequences non 
identifiers en 3'. 

20 Le clonage de eel A sous forme d'un fragment Hindlll-EcoRI a 

ete realise dans le plasmide pMTL23 en utilisant la souche receptrice 
d'E^coli TGI. La souche d' E. coli possedant ce plasmide est bien dotee du 
phenotype CMC+ associe a I'expression de 1'EGA ; l'analyse des fragments 
de restriction obtenus est conforme a ce qui est attendu. 

25 La construction de pPROK-celA (figure. 20) est la suivante : 

On utilise le plasmide pPROK-1 de *,6kb disponible chez 
Clontech Laboratories, Inc. (Palo Alto, CA, USA). 

Ce plasmide replicatif chez E. coli contenant le promoteur tac 
(Brossius et coil. Gene 27:161, 198*) est hydrolyse par EcoRI-NcoI. 

J0 On introduit ensuite dans cette restriction les adaptateurs 

DGF1/DGF2 de la figure 19 sous forme EcoRI-Blunt, ces adaptateurs creent 
le site BstXI. Puis on introduit celA sous forme NaeI(blunt)-NcoI a partir de 
la construction pree'dente. 

Le plasmide ainsi obtenu est den mme pPROK-celA. U 

J5 comporte le gene celA sous le contrdle du pr m teur tac separe par un site 
BstX I introduit grace aux adaptateurs DGF1/DGF2. 
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Fvpm ple lfr. Construction d'un plasmide permettant l'expressi n de 

sequences AO multiples 

Pour realiser l'insertion d'une sequence codant pour 20 unites 
Ala-Gin (AQ) on utilise un deuxieme couple d'oiigonucleotides de synthese 
5 denommes DGF5/DGF6 (figure 1.9) qui correspondent au gene synthetique : 

5' CAG[AQ] 2Q CAGGCA 3' 
3' CCGTGTC[AQ] 2() GT 5' 
[AQ] representant la sequence codant pour Ala-Gin. 

Les extremites des sequences de DGF5 et DGF6 sont 
10 compatibles avec le site BstXI et la sequence peut done etre clonee dans ce 
site. 

Les sequences d'extremites de DGF5 et DGF6 sont telles que„ 

d'une part, elles orientent la direction du clonage, et, d'autre part, eiles 

detruisent le site BstXI a la suite du clonage. 
15 L'utilisation d'adaptateurs non phosphoryles evite d'introduire 

plusieurs genes synthetiques en tandem. 

Apres digestion du pPROK-celA (figure 20) par BstXI et 

ligation du gene synthetique, on obtient : P PROK(AQ) 2() celA ayant la 

structure representee figure 20. 
20 La figure 21 detaille plus particulierement la structure du site 

de fusion AQ/EGA et montre i'interet du site BstXI utilise. Ce site est de 

structure : 

CCATGGCAATGG 
On constate qu'il comporte un codon de depart ATG ainsi que 
25 i e codon codant pour l'alanine, GCA et un 2eme codon ATG pour l'insertion 
d'une methionine apres la sequence codante determinee. 

L'insertion de I'adaptateur DGF5/DGF6 ne peut se faire que 
dans un sens et n'introduit aucune base etrangere a I'objet vise. 

Ce plasmide est traite par BamHI et traite par ligation avec 
30 le produit de restriction du plasmide pCGL125 traite par la meme enzyme. 
Le plasmide pCGL125 (figure 22) est un plasmide fonctionnel de 
Brevibacterium lactofermentum 15 comportant une origine de replication 
pBLl. 
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Par transformation de ladite souche par , le plasmide 
(pCGL125-(AQ) 20 -celA) (pCGL1002 figure 11) et selection des souches 
transformees on obtient une souche selon la presente invention, 

Dans toutes les fusions qui sont realisees, la traduction 
commence par une methionine immediatement suivie par (AQ^q ; on a 
egalement pris la precaution de border (AQ) 2Q par une methionine en 
COOH-terminal ; la detection du polypeptide AQ fusionne ou non a la 
proteine celA peut se faire grace a des anticorps specifiques ou par 
detection analytique apres purification sommaire de la proteine de fusion 
et hydrolyse au bromure de cyanogene ou inversement. Les proprietes 
particulieres des peptides repetes permettent une separation aisee. 

Les souches citees ont les origines suivantes : 
Escherichia coli 

. CLR207 recA B. Bachman 
15 . DH5aipha Gibco BRL 

. GM2929 B. Bachman 

. TGI Institut Pasteur 

Brevibacterium flavum 

. ATCC 1*067 ATCC 
20 Corynebacterium glutamicum (Brevibacterium lactofermentum) 
.15 S. Bonassie 

. ATCC 21086 ATCC 
Corynebacterium glutamicum (Corynebacterium melassecola) 
. ATCC 17965 ATCC 
25 La souche DH5alpha est disponible dans le catalogue de 

Clontech laboratories n° C1021-1 (Palo Alto, CA, USA). 

Les souches ATCC sont disponibles a American Type Culture 
Collection c/o Sales and Marketing Departement, 12301 Parklawn Drive, 
Rockville, MD 20852 USA. 
30 une souche a ete deposee dans la Collection Nationale de 

Cultures de Microorganismes (CNCM) de Hnstitut Pasteur (Paris) le 
23 juillet 1991 : 

• Brevibacterium lactofermentum 15 (CGL2005(B115) sous le n° 1-1126. 
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SEQ ID NO: 4. 

TYPE DE SEQUENCE: Nucleotide et sa proteine correspondante 
LONGEUR DE LA SEQUENCE: 2547 paires de bases 

NOMBRE DE BRINS : double brin avec une representation simple brin 

dans le sens 5' -3' 

CONFIGURATION: lineaire 

TYPE DE MOLECULE: ADN genomique 

ORIGINE 

ORGANISME: Corynebacterium melassecola 
SOUCHE: ATCC17965 

SOURCE EXPERIMENTALE IMMEDIATE : clone pCSPIG 

CARACTERISTIQUES DE LA SEQUENCE 

de 239 a 244 TACATA (signal -35) (S) 

de 269 4 274 TAAGAT (signal -10) (S) 

de 405 a 415 GAGAAGGAAAA site de fixation du ribosome (S) 

de 420 4 2390 sequence codante (S) 

de 420 4 548 peptide signal de proteine secretee (S) 

de 2455 4. 2506 structure en epingle 4 cheveux signal de terminateur 

rho dependant (S) 

ACTIVITE BIOLOGIQUE ASSOCIEE :precurseur de la proteine 
extracellulaire PS1 de Corynebacterium melassecola et de 
Brevibacterlum lactofermentum ~~ 
Homologue du precurseur des proteines du ccaplexe antigenique 
extracellulaire 85 de Mycobacterium 
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AAGCTTCAAGGGGAAAACAAGGGCCTlAAAAGTTATCCACAGATCCGAAGTG 52 

ATCCGCGCACTGGGGTqAAAAGTTATCCACAGpAAGCGGAGGGGCGdATTGA 104 

AAAAf TTCAGCGAAATGCGAAAAGGTGGAGGGGAAATGCTGCGAGTCTTGCGG 156 

ATTCCCGGCGTGGC feTTGAAAAftl AGTCTAAAGTTGAACTTAAGATTGAGGTC 208 

ATTCTGAAGTTGTGACCTGCATCAGAAGAGTTACATACCCACATATGTAACC 2 60 

TTCTGGACTAAGATCACGACAGACTGAAAAGAACTGAAGACTCTCAAGGCAT 312 

AGCCCACGTGTGTTTGTCGGGCCGGAAGCGGGGAACTTTCGGGACGGATCTA 364 

ACTCATTGCGGGCCTGTGCGCAGTATCCAAAAATCAAAAT GAGAAGGA AAAC 416 

TTC ATG CGC GAC ACC GCA TTT CGT TCC ATC AAG GCT AAA 455 
Met Arg Asp Thr Ala Phe Arg Ser lie Lys Ala Lys 

GCT CAG GCT AAG CGC CGT TCC CTC TGG ATT GCA GCA GGC 494 
Ala Gin Ala Lys Arg Arg Ser Leu Trp lie Ala Ala Gly 

GCT GTC CCA ACC GCA ATT GCG TTG ACT ATG TCC CTG GCA 533 
Ala Val Pro Thr Ala lie Ala Leu Thr Met Ser Leu Ala 

CCT ATG GCT TCG GCT CAG TCC AGC AAC CTT TCC TCT GAT 572 
Pro Met Ala Ser Ala Gin Ser Ser Asn Leu Ser Ser Asp 

GCC GTA GTT GGC AGC ATC GCG CAG GGC GTC ACC GAT GGC 611 
Ala Val Val Gly Ser lie Ala Gin Gly Val Thr Asp Gly 

CTG ACT GAC TAC CTG AAG CCT CGC GTC GAA GAG CTT CCT 650 
Leu Thr Asp Tyr Leu Lys Pro Arg Val Glu Glu Leu Pro 

GCT GGT GAA GTC ACC TAC CCA GAG ATC GCC GGG CTG CCT 689 
Ala Gly Glu Val Thr Tyr Pro Glu He Ala Gly Leu Pro 

GAT GGT GTG CGC GTG ATC AGC GCT GAG TGG GCA ACC TCC 728 
Asp Gly Val Arg Val He Ser Ala Glu Trp Ala Thr Ser 

AAG CAT GTC ATT TTG ACT ATT CAG TCT GCA GCA ATG CCA 767 
Lys His Val He Leu Thr He Gin Ser Ala Ala Met Pro 

GAG CGC CCA ATC AAG GTG CAG CTG CTG CTT CCG CGT GAC 806 
Glu Arg Pro He Lys Val Gin Leu Leu Leu Pro Arg Asp 

TGG TAC TCT TCC CCG AAC CGT GAG TTC CCT GAA ATC TGG 845 
Trp Tyr Ser Ser Pro Asn Arg Glu Phe Pro Glu He Trp 

GCA CTT GAC GGT CTG CGC GCG ATT GAA GAG CAG AGT GGT 884 
Ala Leu Asp Gly Leu Arg Ala He Glu Glu Gin Ser Gly 
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TG6 
Trp 


ACC ATT 
Thr lie 


GAG 
Glu 


ACC 
Thr 


AAG 
Lys 


AAC GCC 
Asn Ala 


ATT 
lie 


GTT 
Val 


TCC 
Ser 


TTC TAC 
Phe Tyr 


TCT GAC 
Ser Asp 


AAC 
Asn 


TAC CAG 
Tyr Gin 


TGG 
Trp 


GAG 
Glu 


CCG 
Pro 


ATC CTG 
He Leu 


GAC 
Asp 


AAG 
Lys 


GCC 
Ala 


ATC ACC 
lie Thr 


GGT 
Gly 


ATC 
He 


AAC 
Asn 


ATC GCA 
He Ala 


ACC 
Thr 


CAC 
His 


GGT 
Gly 


TCC TTC 
Ser Phe 


TCC GGC 
Ser Gly 


ATG 
Met 


CCA ATC 
Pro He 


GCT 
Ala 


ATT 
lie 


GGA 
Gly 


TAC GAT 
Tyr Asp 


GCC 
Ala 


AAC 
Asn 


GAG 
Glu 


CGC TGG 
Arg Trp 


CAG 
Gin 


GAA 
Glu 


AAG 
Lys 


CTC AAG 
Leu Lys 


GGC AAG 
Gly Lys 


GGT 
Gly 


GCA GAT 
Ala Asp 


GAC TTC 
Asp Phe 


Gly 


CCT GCA 
Pro Ala 


AAC GCG 
Asn Ala 


TCC 
Ser 


CGT ATG 
Arg Met 


ACT 
Thr 


TCC 
Ser 


CAG 
Gin 


GCT GGC 
Ala Gly 


GTG 
Val 


GAA 
Glu 


GGC 
Gly 


GTG CAC 
Val His 


TCA TGG 
Ser Trp 



AAC ATT GAG CAG TAC 
Asn He Glu Gin Tyr 

GTG CTC CCA ATC GGT 
Val Leu Pro He Gly 

TGG GAA GAG CCA AAC 
Trp Glu Glu Pro Asn 

ACC TTC CTG ACT CAG 
Thr Phe Leu Thr Gin 

GGC TTC CGT TCC AAC 
Gly Phe Arg Ser Asn 

TCC ATG GGC GGT ACC 
Ser Met Gly Gly Thr 

CAC CCA GAC ATG TTT 
His Pro Asp Met Phe 

TAT CTG GAC ACC ACC 
Tyr Leu Asp Thr Thr 

TCC GCA GCC CTG GCA 
Ser Ala Ala Leu Ala 

GCA ATG TGG GGA CCA 
Ala Met Trp Gly Pro 

AAC GAT CCA AAG AGC 
Asn Asp Pro Lys Ser 

ACC ATC TAC GTT TCC 
Thr He Tyr Val Ser 

GGT AAG GAA GAC TCT 
Gly Lys Glu Asp Ser 

ACA GGT GTC GGT CTG 
Thr Gly Val Gly Leu 

CAG ACC TTC GTC GAT 
Gin Thr Phe Val Asp 

GTT GTT GCT AGC TTC 
Val Val Ala Ser Phe 

GAA TAC TGG CAG TTC 
Glu Tyr Trp Gin Phe 



TAC 
Tyr 


GCC 
Ala 


GAT 
Asp 


923 


GGC 
Gly 


GAG 
Glu 


AGC 
Ser 


962 


AAC 
Asn 


GGC 
Gly 


AAG 
Lys 


1001 


GAG 
Glu 


CTC 
Leu 


GCA 
Ala 


1040 


ACC 
Thr 


GAT 
Asp 


CGC 
Arg 


1079 


GCT 
Ala 


GCG 
Ala 


GTT 

val 


1118 


AAG 
Lys 


TTC 
Phe 


GTC 
Val 


1157 


TCC 
Ser 


GCT 
Ala 


GGC 
Gly 


1196 


GAC 
Asp 


GCC 
Ala 


GGC 
Gly 


1235 


GTC 
Val 


GGT 
Gly 


TCT 
Ser 


1274 


AAC 
Asn 


GTA 
Val 


GAC 
Asp 


1313 


TCT 
Ser 


GGT 
Gly 


AAC 
Asn 


1352 


GTA 
Val 


GCT 
Ala 


ATT 
He 


1391 


GAA 
Glu 


GTT 
Val 


ATC 
He 


1430 


CGT 
Arg 


GCA 
Ala 


AAC 
Asn 


1469 


CGT 
Arg 


CCA 
Pr 


TCC 
Ser 


1508 


GAG 
Glu 


ATG 
Met 


ACT 
Thr 


1547 
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CAG GCG TTC CCT CAC ATC GCT AAC GCT CTT GGC ATG TCC 1586 
Gin Ala Phe Pro His lie Ala Asn Ala Leu Gly Met Ser 

ACT GAG GAC CGT GGC GTT GAG TGT GCA CCT GTC GGC GCA 1625 
Thr Glu Asp Arg Gly Val Glu Cys Ala Pro Val Gly Ala 

ATC GCT GAC GCT GTT GCC GAC GGC GCG ATG GGC ACC TGC 1664 
lie Ala Asp Ala Val Ala Asp Gly Ala Met Gly Thr Cys 

CTG ACC AAC GAA TAC GAT GTT ACC GGC GGT AAG GCC CAG 1703 
Leu Thr Asn Glu Tyr Asp Val Thr Gly Gly Lys Ala Gin 

GAC TTC GCT AAC GGT CGC GCA TAC TGG TCT GCA AAC ACT 1742 
Asp Phe Ala Asn Gly Arg Ala Tyr Trp Ser Ala Asn Thr 

GGC GCT TTC GGC CTG GTT GGA CGC ATC AAC GCT CGT TAC 1781 
Gly Ala Phe Gly Leu Val Gly Arg He Asn Ala Arg Tyr 

TCT GAG CTG GGT GGA CCT GAC TCC TGG TTG GGC TAC CCA 1820 
Ser Glu Leu Gly Gly Pro Asp Ser Trp Leu Gly Tyr Pro 

ACC TCT TCT GAG TTG AAG ACA CCA GAC GGA CGT GGC CGC 1859 
Thr Ser Ser Glu Leu Lys Thr Pro Asp Gly Arg Gly Arg 

TTC GTC ACC TTC GAG CAC GGC TCC ATC TAC TGG ACC GCC 1898 
Phe Val Thr Phe Glu His Gly Ser He Tyr Trp Thr Ala 

ACC ACT GGT CCT TGG GAA ATC CCA GGC GAT ATG CTC GCC 1937 
Thr Thr Gly Pro Trp Glu He Pro Gly Asp Met Leu Ala 

GCA TGG GGC ACC CAG GAC TAT GAG AAG GGC AGC CTC GGC 1976 
Ala Trp Gly Thr Gin Asp Tyr Glu Lys Gly Ser Leu Gly 

TAC CCA ACC GGC GCC GCA GTT GAA TAC AAC GGT GGC CTG 2015 
Tyr Pro Thr Gly Ala Ala Val Glu Tyr Asn Gly Gly Leu 

CGC CAG CAG TTC GAA GGT GGC TAC GTA TTC CGT ACC TCC 2054 
Arg Gin Gin Phe Glu Gly Gly Tyr Val Phe Arg Thr Ser 

AAT AAC CAG TCT TAC TGG GTT CGC GGA GAA ATC TCC AAG 2093 
Asn Asn Gin Ser Tyr Trp Val Arg Gly Glu He Ser Lys 

AAG TAC GCC GAT GAC GGA ATC TTC GCT CAG CTT GGT TTC 2132 
Lys Tyr Ala Asp Asp Gly He Phe Ala Gin Leu Gly Phe 

CCA ACC GGC AAT GAG AAG TTG ATC AAC GGT GGC GCT TTC 2171 
Pro Thr Gly Asn Glu Lys Leu He Asn Gly Gly Ala Phe 

CAG GAA TTC GAA AAG GGC AAC ATC TAC TGG TCC GTG TCC 2210 
Gin Glu Phe Glu Lys Gly Asn He Tyr Trp Ser Val Ser 
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ACT GGC GCG CAC GTG ATT CTG CAC GGC GAC ATC TTC GAC 2249 
Thr Gly Ala His Val He Leu His Gly Asp He Phe Asp 

GCA TGG GGT GCT AAG GGC TGG GAG CAG GGC GAA TAC GGC 2288 
Ala Trp Gly Ala Lys Gly Trp Glu Gin Gly Glu Tyr Gly 

TTC CCA ACC TCT GAC CAG ACC GCA ATC ACC GCG GGT GGA 2327 
Phe Pro Thr Ser Asp Gin Thr Ala lie Thr Ala Gly Gly 

CAG ACC ATT GAT TTC CAG AAC GGC ACC ATC CGT CAG GTC 2366 
Gin Thr He Asp Phe Gin Asn Gly Thr He Arg Gin Val 

AAT GGC CGA ATT GAG GAG TCT CGC TAATAGTGA AGCGCATCTA 2409 
Asn Gly Arg He Glu Glu Ser Arg 

CGC^CTCTCGCTTCCGGACTTTTGTGCCTGAGCCTTGCTGCTTGTGGGGGA 24 61 
GTCACTGTTGAAGGAGATGATTCTCCCTCGACAGCGGCAGCCCCAACAGAAA 2513 



GCAGCGCTGGGTCAAGCAGCACCGCAAGGTCGAC 2547 
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SEQ ID NO: V 

TYPE DE SEQUENCE: Nucleotide et sa proteine correspondante 
LONGEUR DE LA SEQUENCE : 2702 paires de bases 

NOMBRE DE BRINS : double brin avec une representation simple brin 

dans le sens 5 '-3' 

CONFIGURATION : lineaire 

TYPE DE MOLECULE: ADN genomique 

ORIGINE 

ORGAN IS ME : Corynebacterium melassecola 
SOUCHE: ATCC17965 

SOURCE EXPERIMENT ALE IMMEDIATE: clone pCGL815, pCGL824 
CARACTERISTIQUES DE LA SEQUENCE 

de 562 a 567 AAGGAG site de fixation du ribosome (S) 
de 579 a 2108 sequence codante (S) 

de 579 a 668 peptide signal de proteine secret6e (S) 

de 2188 a 2333 structure en epingle a cheveux signal de terminateur 

de transcription (S) 

ACTIVITE BIOLOGIQUE ASSOCIEE :pr£curseur de la proteine constituant 
la couche de surface externe de la parol et de 1' antigene 
extracellulaire PS2 de Corynebacterium melassecola et de 
Brevibacterium lactofermentum. 
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GAATTCCTGTGAATTAGCCGGTTTAGTACTTTTCAGGGGTGTCTATTCTTAC 52 

CAGATCGTCAAGTTGTGGGTAGAGTCACCTGAATATTAATTGCACCGCACGG 104 

GTGATATATGCTTATTTGCTCAAGTAGTTCGAGGTTAAGTGTATTTTAGGTG 156 

AACAAATTTCAGCTTCGGGTAGAAGACTTTCTATGCGCTTCAGAGCTTCTAT 208 

TAGGAAATCTGACACCACTTGATTAAATAGCCTACCCCCGAATTGGGGGATG 260 

GGTCATTTTTTGCTGTGAAGGTAGTTTTGATGCATATGACCTGCGTTTATAA 312 

AGAAATGTAAACGTGATCAGATCGATATAAAAGAAACAGTTTGTACTCAGGT 364 

TTGAAGCATTTTCTCCGATTCGCCTGGCAAAAATCTCAATTGTCGCTTACAG 416 

TTTTTCTCAACGACAGGCTGCTAAGCTGCTAGTTCGGTGGCCTAGTGAGTGG 468 

CGTTTACTTGGATAAAAGTAATCCCATGTCGTGATCAGCCATTTTGGGTTGT 520 

TTCCATAGQUITCCAAAGGTTTCGTCTTTCGATACCTATTCAAGGAGCCTTC 572 



GCCTCT ATG TTT AAC AAC CGT ATC CGC ACT GCA GCT CTT 611 
Met Phe Asn Asn Arg He Arg Thr Ala Ala Leu 



GCT 
Ala 


GGT 
Gly 


GCA 
Ala 


ATC 
He 


GCA 
Ala 


ATC 
He 


TCC 
Ser 


ACC 
Thr 


GCA 
Ala 


GCT 
Ala 


TCC 
Ser 


GGC 
Gly 


GTT 
Val 


650 




GCT 
Ala 


ATC 
He 


CCA 
Pro 


GCA 
Ala 


TTC 
Phe 


GCT 
Ala 


CAG 
Gin 


GAG 
Glu 


ACC 
Thr 


AAC 
Asn 


CCA 
Pro 


ACT 
Thr 


TTC 
Phe 


689 




AAC 
Asn 


ATC 
He 


ACC 
Thr 


AAC 
Asn 


GGC 
Gly 


TTC 
Phe 


AAC 
Asn 


GAT 
Asp 


GCT 
Ala 


GAT 
Asp 


GGA 
Gly 


TCC 
Ser 


ACC 
Thr 


728 




ATC 
He 


CAG 
Gin 


CCA 
Pro 


GTT 
Val 


GGC 
Gly 


CCT 
Pro 


GTT 
Val 


AAC 
Asn 


CAC 
His 


ACC 
Thr 


GAG 
Glu 


GAA 
Glu 


ACC 
Thr 


767 




CTC 
Leu 


CGC 
Arg 


GAC 
Asp 


CTG 
Leu 


ACT 
Thr 


GAC 
ASp 


TCC 
Ser 


ACC 
Thr 


GGC 

Gly 


GCT 
Ala 


TAC 
Tyr 


CTG 
Leu 


GAA 
Glu 


806 




GAG 
Glu 


TTC 
Phe 


CAG 
Gin 


AAC 
Asn 


GGC 
Gly 


ACC 
Thr 


GTT 
Val 


GAG 
Glu 


GAA 
Glu 


ATC 
He 


GTT 
Val 


GAA 
Glu 


GCA 
Ala 


845 




TAC 
Tyr 


CTG 
Leu 


CAG 
Gin 


GTT 
Val 


CAG 
Gin 


GCT 
Ala 


TCC 
Ser 


GCA 
Ala 


GAC 
Asp 


GGA 
Gly 


TTC 
Phe 


GAT 
Asp 


CCT 
Pro 


884 




TCT 
Ser 


GAG 
Glu 


CAG 
Gin 


GCT 
Ala 


GCT 
Ala 


TAC 
Tyr 


GAG 
Glu 


GCT 
Ala 


TTC 
Phe 


GAG 
Glu 


GCT 
Ala 


GCT 


CGC 
Arg 


923 


4 


GTC 
Val 


CGT 
Arg 


GCA 
Ala 


TCC 
Ser 


CAG 
Gin 


GAG 
Glu 


CTC 
Leu 


GCA 
Ala 


GCT 
Ala 


TCC 
Ser 


GCT 
Ala 


GAG 
Glu 


ACC 
Thr 


962 
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ATC ACC AAG ACC CGC GAG TCC GTT GCT TAC GCA CTC AAG 1001 
He Thr Lys Thr Arg Glu Ser Val Ala Tyr Ala Leu Lys 

GTT GAC CAG GAA GCT ACC GCT GCT TTC GAG GCA TAC CGC 1040 
Val Asp Gin Glu Ala Thr Ala Ala Phe Glu Ala Tyr Arg 

AAC GCA CTT CGC GAT GCA GCT ATC TCT ATC AAC CCA GAT 1079 
Asn Ala Leu Arg Asp Ala Ala He Ser He Asn Pro Asp 

GGC TCT ATC AAC CCA GAT ACC TCT ATC AAC CTA CTG ATC 1118 
Gly Ser He Asn Pro Asp Thr Ser He Asn Leu Leu He 

GAT GCT GCT AAC GCT GCT AAC CGC ACC GAT CGT GCA GAG 1157 
Asp Ala Ala Asn Ala Ala Asn Arg Thr Asp Arg Ala Glu 

ATC GAG GAT TAC GCT CAC CTT TAC ACC CAG ACC GAT ATT 1196 
He Glu Asp Tyr Ala His Leu Tyr Thr Gin Thr Asp He 

GCT CTT GAA ACT CCA CAG CTT GCA TAC GCT TTC CAG GAC 1235 
Ala Leu Glu Thr Pro Gin Leu Ala Tyr Ala Phe Gin Asp 

CTG AAG GCT CTT CAG GCT GAG GTC GAC GCA GAC TTC GAG 1274 
Leu Lys Ala Leu Gin Ala Glu Val Asp Ala Asp Phe Glu 

TGG TTG GGC GAG TTC GGA ATC GAC CAG GAA GAC GGT AAC 1313 
Trp Leu Gly Glu Phe Gly He Asp Gin Glu Asp Gly Asn 

TAC GTT CAG CGC TAC CAC .CTC CCT GCT GTA GAG GCA CTC 1352 
Tyr Val Gin Arg Tyr His Leu Pro Ala Val Glu Ala Leu 

AAG GCT GAG GTC GAC GCT CGC GTC GCA GCA ATT GAG CCA 1391 
Lys Ala Glu Val Asp Ala Arg Val Ala Ala He Glu Pro 

CTT CGT GCA GAC TCC ATC GCT AAG AAC CTT GAG GCG CAG 1430 
Leu Arg Ala Asp Ser He Ala Lys Asn Leu Glu Ala Gin 

AAG TCT GAC GTT CTG GTT CGC CAG CTC TTC CTC GAG CGT 1469 
Lys Ser Asp Val Leu Val Arg Gin Leu Phe Leu Glu Arg 

GCA ACC GCA CAG CGC GAC ACC CTG CGT GTT GTA GAG GCG 1508 
Ala Thr Ala Gin Arg Asp Thr Leu Arg Val Val Glu Ala 

ATC TTC TCT ACC TCT GCT CGT TAC GTT GAA CTC TAC GAG 1547 
He Phe Ser Thr Ser Ala Arg Tyr Val Glu Leu Tyr Glu 

AAC GTC GAG AAC GTT AAC GTT GAG AAC AAG ACC CTT CGC 1586 
Asn Val Glu Asn Val Asn Val Glu Asn Lys Thr Leu Arg 
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CAG CAC TAC TCT GCG CTG ATC CCT AAC CTC TTC ATC GCA 1625 
Gin His Tyr Ser Ala Leu Xle Pro Asn Leu Phe He Ala 

GCA GTT GCA AAC ATC AGC GAG CTC AAC GCT GCA GAT GCT 1664 
Ala Val Ala Asn He Ser Glu Leu Asn Ala Ala Asp Ala 

GAA GCA GCA GCT TAC TAC CTC CAC TGG GAC ACC GAC CTC 1703 
Glu Ala Ala Ala Tyr Tyr Leu His Trp Asp Thr Asp Leu 

GCA ACC AAC GAT GAG GAC GAA GCT TAC TAC AAG GCT AAG 1742 
Ala Thr Asn Asp Glu Asp Glu Ala Tyr Tyr Lys Ala Lys 

CTC GAC TTC GCT ATC GAG ACC TAC GCA AAG ATC CTG TTC 1781 
Leu Asp Phe Ala lie Glu Thr Tyr Ala Lys lie Leu Phe 

AAC GGT GAA GTT TGG CAG GAG CCA CTG GCT TAC GTC CAG 1820 
Asn Gly Glu Val Trp Gin Glu Pro Leu Ala Tyr Val Gin 

AAC CTG GAT GCA GGC GCA CGT CAG GAA GCA GCT GAC CGT 1859 
Asn Leu Asp Ala Gly Ala Arg Gin Glu Ala Ala Asp Arg 

GAG GCA GCT CGC GCA GCT GAC GAA GCT TAC CGC GCT GAG 1898 
Glu Ala Ala Arg Ala Ala Asp Glu Ala Tyr Arg Ala Glu 

CAG CTC CGC ATC GCT CAG GAA GCA GCT GAC GCT CAG AAG 1937 
Gin Leu Arg He Ala Gin Glu Ala Ala Asp Ala Gin Lys 

GCT ATC GCT GAG GCG CTT GCT AAG GAA GCA GAA GGC AAC 1976 
Ala He Ala Glu Ala Leu Ala Lys Glu Ala Glu Gly Asn 

AAC GAC AAC TCC TCC GAC AAC ACG GAG ACC GGT TCT TCT 2015 
Asn Asp Asn Ser Ser Asp Asn Thr Glu Thr Gly Ser Ser 

GAC ATC GGA TCC TGG GGA CCT TTC GCA GCA ATT GCA GCT 2054 
Asp He Gly Ser Trp Gly Pro Phe Ala Ala He Ala Ala 

ATC ATC GCA GCA ATC GCA GCT ATC TTC CCA TTC CTC TCC 2093 
He He Ala Ala He Ala Ala He Phe Pro Phe Leu Ser 

GGT ATC GTT AAG TTC TAA TTTCGAACCGAGATAGCTAAAAGTTAAA 2139 
Gly He Val Lys Phe 

CCACCTCCTTTCTTGCGGGAGGTGGTTTTTCCCTTGGCTAACAGCAC CAAAA 2191 
GAAAAGCCACCTCCTTGATCTCAAGGAGGTGGCTTATCTTTTATTTACTGGG 2243 



GAGCCGGAGGTTGGCGTCGATAAGCAAAAATCTTTTGCTTTTAAGGGAACGT 2295 
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GATAATCGGCTTAATGACTCGCCACTGGCGGAATCCGCAAAGGCATCATTGA 2347 
TTTGTTCCAGCGGGTAAGTGCGCACGAGCTTCTCGATCGGGAACTTGCCCTG 2399 
GCGCCACAAATGAACCAGGCGAGGGATGAAATCCTGAGGGACGGCGTCGCCC 2451 
TCAATGATGGTCTGGAACTTCCAACCACGGACCAGTGACGCGCCAACCTCGA 2503 
AGGTAGCTTCCGTGCCAGGGGCAGGGGCGCCGACGAGACCGACGGTACCGTT 2555 
GATCGCCAAGGAATCGGCTGCTTGCCTGGTCACGGCCACGACACCAGTTGTA 2 607 
TCGAGAGCGAATTGCACACCATCGCCGGTCAGTTCCTTGATTTTCTCCGCAG 2659 
GATCCTCATCCTTGGAGTTGATCGTGTGGGTAGCTCCGAGCTC 2702 



V 
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CPA TD NO * 

type DE SEQUENCE : Nucleotide et sa proteine correspondante 
LONGEUR DE LA SEQUENCE : 2160 paires de bases 

NOMBRE DE BRINS: double brin avec une representation simple brin 

dans le sens 5' -3' 

CONFIGURATION: lineaire 

TYPE DE MOLECULE: ADN genonuque 

ORIGINE . 
ORGANISME: Corynebactenum melassecola 

ISuRCe'e^ERIMENTALE IMMEDIATE: pCGL315, P CGL313,pCGL310 
CARACTERISTIQUES DE LA SEQUENCE 

de 251 a 266 TGGTCATATCTGTGCG site de promoteur reconnu par le 

facteur sigma 60 et regule par 1' ammonium (S) 

de 437 a 442 TTCACA signal de promoteur region -35 (S) 

de 466 a 471 TAGGAT signal de promoteur region -10 (S) 

de 558 a 572 GGGAACGAGGAAATC site de fixation du nbosome (S) 

de 573 a 1913 sequence codante (S) 

de 1937 a 1977 structure en epingle a cheveux signal de terminateur 
de transcription rho-independant (S) 

ACTIVITE BIOLOGIQUE ASSOCIEE :activite glutamate deshydrogenase 
NADPH dependante migrant en gel denaturant comme un polypeptide de 
48300d. 
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GCTAGCCTCGGGAGCTCTAGGAGATTGTGAAAAACGGGTCAAATTTCTCCGA 5 2 

TGCAGCGCCTATAAAAGTCGTACCAATTCCATTTGAGGGTGCTCAAGTGTGG 104 

CCAGGTTATATAACCAGTCAGTCAACTGGTCTCATTCGCTGGTCGGATGAAT 15 6 

TTAATTAAAGAAGAGACTTCATGCAGTTACCGCGCGTTTTGGCGATACACAA 208 

TTGATAAACCTAAAGAAATTTTCAAACAATTTTAATTCTTTGTGGTCATATC 260 

TGTGCGACACTGCCATAATTGAACGTGAGCATTTACCAGCCTAAATGCCCGC 312 

AGTGAGTTAAGTCTCAAAGCAAGAAGTTGCTCTTTAGGGCATCCGTAGTTTA 364 

AAACTATTAACCGTTAGGTATGACAAGCCGGTTGATGTGAACGCAGTTTTTA 416 

AAAGTTTCAGGATCAGATTTTTCACAGGCATTTTGCTCCAGCAAACGCCTAG 468 

GATGTACATGGTGCCCTCAATGGGAACCACCAACATCACTAAATGGCCCAGA 520 

TACACACTTTAAAATCGTGCGCGCATGCAGCCGAGATGGGAACGAGGAAATC 572 

ATG ACA GTT GAT GAG CAG GTC TCT AAC TAT TAC GAG ATG 611 
met thr val asp glu gin val ser asn tyr tyr asp met 

CTT CTG AAG CGC AAT GCT GGC GAG CCT GAA TTT CAC CAG 650 
leu leu lys arg asn ala gly glu pro glu phe his gin 

GCA GTG GCA GAG GTT TTG GAA TCT TTG AAG ATC GTC CTG 689 
ala val ala glu val leu glu ser leu lys ile val leu 

GAA AAG GAC CCT CAT TAC GCT GAT TAC GGT CTC ATC CAG 728 
glu lys asp pro his tyr ala asp tyr gly leu ile gin 

CGC CTG TGC GAG CCT GAG CGT CAG CTC ATC TTC CGT GTG 767 
arg leu cys glu pro glu arg gin leu ile phe arg val 

CCT TGG GTT GAT GAC CAG GGC CAG GTC CAC GTC AAC CGT 806 
pro trp val asp asp gin gly gin val his val asn arg 

GGT TTC CGC GTG CAG TTC AAC TCT GCA CTT GGA CCA TAC 845 
gly phe arg val gin phe asn ser ala leu gly pro tyr 

AAG GGC GGC CTG CGC TTC CAC CCA TCT GTA AAC CTG GGC 884 
lys gly gly leu arg phe his pro ser val asn leu gly 

ATT GTG AAG TTC CTG GGC TTT GAG CAG ATC TTT AAA AAC 923 
ile val lys phe leu gly phe glu gin ile phe lys asn 

TCC CTA ACC GGC CTG CCA ATC GGT GGT GGC AAG GGT GGA 962 
ser leu thr gly leu pro il gly gly gly lys gly gly 
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TCC GAC TTC GAC CCT AAG GGC AAG TCC GAT CTG GAA ATC 1001 
ser asp phe asp pro lys gly lys ser asp leu glu ile 

ATG CGT TTC TGC CAG TCC TTC ATG ACC GAG CTG CAC CGC 1040 
met arg phe cys gin ser phe met thr glu leu his arg 

CAC ATC GGT GAG TAC CGC GAC GTT CCT GCA GGT GAC ATC 1079 
his ile gly glu tyr arg asp val pro ala gly asp ile 

GGA GTT GGT GGC CGC GAG ATC GGT TAC CTG TTT GGC CAC 1118 
gly val gly gly arg glu ile gly tyr leu phe gly his 

TAC CGT CGC ATG GCC AAC CAG CAC GAG TCC GGC GTT TTG 1157 
tyr arg arg met ala asn gin his glu ser gly val leu 

ACC GGT AAG GGC CTG ACC TGG GGT GGA TCC CTG GTC CGC 1196 
thr gly lys gly leu thr trp gly gly ser leu val arg 

ACC GAG GCA ACT GGC TAC GGC TGC GTT TAC TTC GTG AGT 1235 
thr glu ala thr gly tyr gly cys val tyr phe val ser 

GAA ATG ATC AAG GCT AAG GGC GAG AGC ATC AGC GGC CAG 1274 
glu met ile lys ala lys gly glu ser ile ser gly gin 

AAG ATC ATC GTT TCC GGT TCC GGC AAC GTA GCA ACC TAC 1313 
lys ile ile val ser gly ser gly asn val ala thr tyr 

GCG ATT GAA AAG GCT CAG GAA CTC GGC GCA ACC GTT ATT 1352 
ala ile glu lys ala gin glu leu gly ala thr val ile 

GGT TTC TCC GAT TCC AGC GGT TGG GTT CAT ACC CCT AAT 1391 
gly phe ser asp ser ser gly trp val his thr pro asn 

GGC GTT GAC GTG GCT AAG CTC CGC GAA ATC AAG GAA GTT 1430 
gly val asp val ala lys leu arg glu ile lys glu val 

CGC CGC GCA CGC GTA TCC GTG TAC GCC GAC GAA GTT GAA 1469 
arg arg ala arg val ser val tyr ala asp glu val glu 

GGC GCA ACC TAC CAC ACC GAC GGG TCC ATC TGG GAT CTC 1508 
gly ala thr tyr his thr asp gly ser ile trp asp leu 

AAG TGC GAT ATC GCT CTT CCT TGT GCA ACT CAG AAC GAG 1547 
lys cys asp ile ala leu pro cys ala thr gin asn glu 

CTC AAC GGT GAG AAC GCT AAG ACT CTT GCA GAC AAC GGC 1586 
leu asn gly glu asn ala lys thr leu ala asp asn gly 

TGC CGT TTC GTT GCT GAA GGC GCG AAC ATG CCT TCC ACC 1625 
cys arg phe val ala glu gly ala asn met pro ser thr 
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CCA GAG GCT GTT GAG GTC TTC CGT GAG CGC GAC ATC CGC 1664 
pro glu ala val glu val phe arg glu arg asp ile arg 

TTC GGA CCA GGC AAG GCA GCT AAC GCT GGT GGC GTT GCA 1703 
phe gly pro gly lys ala ala asn ala gly gly val ala 

ACC TCC GCT CTG GAG ATG CAG CAG AAC GCT TCG CGC GAT 1742 
thr ser ala leu glu met gin gin asn ala ser arg asp 

TCC TGG AGC TTC GAG TAC ACC GAC GAG CGC CTC CAG GTG 1781 
ser trp ser phe glu tyr thr asp glu arg leu gin val 

ATC ATG AAG AAC ATC TTC AAG ACC TGT GCA GAG ACC GCA 1820 
ile met lys asn ile phe lys thr cys ala glu thr ala 

GCA GAG TAT GGA CAC GAG AAC GAT TAC GTT GTC GGC GCT 1859 
ala glu tyr gly his glu asn asp tyr val val gly ala 

AAC ATT GCT GGC TTC AAG AAG GTA GCT GAC GCG ATG CTG 1898 
asn ile ala gly phe lys lys val ala asp ala met leu 

GCA CAG GGC GTC ATC TAA GACCCCTGCACTTTACTTAAACCCCTGA 1944 
ala gin gly val ile OCB 

TCCGCGTTAAGGATCAGGGATTTTTGATTTCTTCCAGGTCAATTATCCGATC 1996 
CACATGGGTTAATGCAGCTGTGCGGTGCGCAATGATGATCACCGTGGTGTCT 2048 
TTAAGCGTGGCCAGAGTCTGGGAAAGATCCGCTTGATTGAGCGCATCTTGGT 2100 
GGCTGGTGGCTTCATCGACAATCAGTACCTGAGGGGTGCGTGCCAAAGCACG 2152 
CGCCAGGCAGAGCCGTTGTTGCTGTCCGCCAGATAGGC 2190 
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FIGURE 8 : 

A as p : promoteur de cspl 

s : sequence signal * 
putative de cspl 
m :30 premiers acides 
amines de PS1 mature 



FIGURE 9 : 

A = p : promoteur de cspl 

s : sequence signal putative de cspl 

m : 30 premiers acides amines de PS1 mature 

Detail de sequence de 5* en 3' 

CCTCGCOTX^ 

ACCCCGGCAMCACTGTGTCAGCGGCAGGTGTGCCTnTMCAC 

CCCTATGGTCCTACTTCTATTGCCGATMTCAGTCGGAAGTAACTGCAA^ 

CTCAAAGCAGAATGGGAAGACTGGAAGAGCAAGAGAATTACCTCGAACGGT 

GCAGGAGGATA 



FIGURE 10 : 



A = p : promoteur de cspl . 

s : sequence signal putative de cspi 
m : 30 premiers acides amines de PS1 mature 

Detail de sequence de 5' en 3' 

CCTTTCCTCTGATGCCGTAGTTGGCAGCATCGCGCAGGGCGTCACCGATGG 

CCTGACTGACTACCTGAAGCCTCGCGTCGAAGACCTGCAGCCCAATTCCAT 

GGCACAGAAGGCACAGAAGGCACAGAAGGCACAGAAGGCACAGAAGGCACA 

GAAGGCACAGAAGGCACAGAAGGCACAGAAGGCACAGAAGGCAATGGCCGG 

CCTGTCGACCCCGGCAAACACTGTGTCAGCGGCAGGTGTG 
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FIGURE 11 : 

A = p : promoteur de cspl 

s : sequence signal putative de csd1 

m : 30 premiers acides amines de PS1 mature 



Detail de sequence de 5' en 3' 

CCTTTCCTCTGATGCCGTAGTTGGCAGCATCGCGCAGGGCGTCACCGATGG 

CCTGACTGACTACCTGAAGCCTCGCGTCGAAGACCTGCAGCCCAATTCCAT 

GGCACAGGCACAGGCTCAGGCCCAGGCACAGGCCCAGGCGCAGGCCCAGGC 

CCAGGCTCAGGCACAGGCGCAGGCGCAGGCACAGGCACAGGCTCAGGCGCA 

GGCTCAGGCTCAGGCAATGGCCGGCCTGTCGACCCCGGCAAACACTGTGTC 
AGCGGCAGGT 



FIGURE 22 : 



Polylinkeii : 0.001/Sacll.BstXI.Notl.Xbal. 
Polylinker2: 1.531/Clal.Sall.Aatl.Mlul.Ncol.Bglll.Xhol.Stul.Pstl. 
Smal.BamHI.Spel. 

Polylinker3: 1 .561/Xbal.Notl.Sacll.BstXI. 
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REVENDICATIONS 

1. Systeme d'expression et de secretion d'un amino-acide, 
polypeptide ou proteine determine par une souche de corynebacterie, 
caracterise en ce que la sequence qui code pour ledit amino-acide, 

* polypeptide ou ladite proteine est situee dans une region d'ADN 
chromosomique ou plasmidique oil ladite sequence est transcrite avec vers 
l'extremite 5' au moins une partie de la sequence codant pour ia sequence 
signal de la proteine PS1 ou PS2, ladite partie assurant la secretion de 
ladite proteine apres traduction lorsque le systeme est incorpore dans 
10 ladite souche de corynebacterie. 

2. Systeme d'expression et de secretion dans une coryne- 
bacterie comprenant : 

- une souche de corynebacterie, 

- une cassette de secretion contenant une premiere sequence d'ADN" 
I* fonctionnelle pour 1'expression dans ladite souche de corynebacterie, une 

seconde sequence d'ADN qui code pour un aminoacide, un polypeptide et/ou 
une proteine, et une troisieme sequence d'ADN inseree entre lesdites 
premiere et seconde sequences d'ADN qui codent pour des elements d'une 
proteine choisie parmi PS1 ou PS2, qui assurent Ia- secretion desdits 
20 amino-acides, polypeptides et/ou proteines de ladite souche de coryne- 
bacterie. 

3. Systeme d'expression et de secretion selon Tune des 
revendications I ou 2, caracterise en ce que la souche de corynebacterie 
est du genre Brevibacterium. 

25 4. Systeme d'expression et de secretion ' selon I'une des 

revendications I a 3, caracterise en ce que la premiere sequence d'ADN 
• fonctionnelle pour 1'expression comporte un promoteur et un site de 

fixation- des ribosomes. 

5. Systeme d'expression et de secretion selon Tune des 
30 revendications 1 a 4, caracterise en ce que la cassette de secretion est 

portee par un plasmide autoreplicatif comportant une origine de replication 
fonctionnelle dans la souche de corynebacterie. 

6. Systeme d'expression et de secretion selon Tune des 
r vendications 1 a 5, caracterise en ce que la cassette de secretion 

35 comporte des elements d'ADN assurant son integration dans le chromosome 
de la souche de coryn'bacterie. 
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7. Systeme d'expression et de secretion selon l'une des 
revendicatons 1 a 6, caracterise en ce que la troisieme sequence d'ADN 
comporte tout ou partie de la sequence signal de P51 ou PS2. 

8. Systeme d'expression et de secretion selon l'une des 
5 revendications 1 a 7, caracterise en ce qu'il comporte, en outre, une 

sequence d'arret de la traduction, une sequence d'arret de la transcription 
a la fin de la sequence codante et un gene marqueur. 

9. Systeme selon l'une des revendications I a 8, caracterise en 
ce que la sequence qui code pour un amino-acide, polypeptide ou proteine 

10 determine est inseree dans le gene cspl ou csp2 en phase. 

10. Systeme selon l'une des revendications 1 a 9, caracterise 
en ce que la sequence de PS1 ou PS 2 est tronquee. 

11. Systeme selon l'une des revendications I a 10, caracterise 
en ce que l'expression et secretion de 1'amino-acide, polypeptide ou 

15 proteine determine est regulee par la temperature, le milieu de culture et 
la nature des sucres. 

12. Systeme selon l'une des revendications 1 a 11, caracterise 
en ce que la sequence codante est une sequence codante pour un polymere 
d'un ou plusieurs amino acides repetes. 

20 13. Systeme selon l'une des revendications I a 12, caracterise 

en ce que 1'unite repetee dans la sequence repetitive contient en position 
COOH terminale un acide amine charge positivement ou negativement. 

1». Systeme selon l'une des revendications 1 a 13, caracterise 
en ce que le caractere ionique du polypeptide permet ,son isolement. 

25 15. Systeme selon l'une des revendications 1 a U, caracterise 

en ce que l'acide amine charge permet le clivage par une protease 
specifique du polypeptide a son niveau. 

16. Systeme selon l'une des revendications 1 a 15, caracterise 
en ce que l'acide amine charge peut €tre enleve par une carboxypeptidase 

30 specifique. 

17. Systeme selon l'une des revendications I a 16, caracterise 
en ce que le gene marqueur est le gene celA. 

18. Systeme selon l'une des revendications 1 a 17, caracterise 
en c qu la sequence codante c mporte tout ou partie du gene gdhA 

35 correspondant a la figure 17. 
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19. Systeme selon Tune des revendications 1 a 18, caracterise 
en ce que les sequences d'ADN fonctionnelies pour Texpression sont choisies 
parmi les elements depression de cspl, csp2 ou gdhA. 

20. Systeme selon Tune des revendications I a 19, caractense 
5 en ce que Texpression depend de la concentration en sels, metabolites et 

sucres. 

21. Systeme selon Tune des revendications 1 a 20, dans lequel 
ie promoteur, avant Texpression de la sequence codante, est choisi parmi 
les promoteurs de cspl , csp2 ou gdhA. 

10 22. Systeme selon Tune des revendications 1 a 21, caracterise 

en ce que ie gene marque ur est le gene lacZ. 

23. Souche bacterienne obtenue par la mise en oeuvre du 
systeme d'expression et de secretion selon Tune des revendications 1 a 2\. 

2*. Souche selon la revendication 23, caracterisee en ce qu'il 
15 s'agit d'une corynebacterie. 

25. Souche de corynebacterie selon la revendication 2b, 
caracterisee en ce qu'il s'agit de Brevibacterium. 

26. Souche de corynebacterie selon la revendication 25, 
caracterisee en ce qu'il s'agit d r une souche de Brevibacterium lacto- 

20 fermentum. 

27. Souche de corynebacterie selon Tune des revendications 23 
a 26, caracterisee en ce que la proteine determinee est ancree sur la parol 
par la partie de PS1 ou PS2 ayant cette fonction d'ancrage. 

28* Souche de corynebacterie selon Tune de* revendications 23 
25 a 2&* caracterisee en ce qu'elle presente les epitopes antigeniques de P51 
ou P52* ancres sur sa paroi. 

29* Precede d'obtention d'un amino-acide, d'un polypeptide, 
d'une proteine caracterise en ce que Ton cultive en un milieu de culture 
une souche de corynebacterie selon Tune des revendications 23 a 28, dans 
30 iaquelle la seconde sequence d'ADN code pour ledit amino-acide, ledit poly- 
peptide, ladite proteine et en ce que Ton separe eventuellement apres 
culture ledit produit du milieu de culture et/ou du concentrat bacterien. 



35 
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30. Procede selon la revendication 29, caracterise en ce qu'on 
separe la proteine determined fusionnee ou non avec PS I ou PS2 des 
cellules bacteriennes par utilisation d'un agent tensio-actif. 

31. Proteine comportant tout ou partie de Ja sequence de P51 

5 ou PS2. 

32. Proteine comportant les sites antigeniques de PS I ou PS2. 

33. A titre d'element antigenique, une proteine selon Tune des 
revendications 31 et 32. 

34. Anticorps diriges contre PS1 ou PS2. 
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CAG GCG TTC CCT CAC ATC GCT AAC GCT CTT GGC ATG TCC 1586 
Gin Ala Phe Pro His lie Ala Asn Ala Leu Gly Met Ser 

ACT GAG GAC CGT GGC GTT GAG TGT GCA CCT GTC GGC GCA 1625 
Thr Glu Asp Arg Gly Val Glu Cys Ala Pro Val Gly Ala 

ATC GCT GAC GCT GTT GCC GAC GGC GCG ATG GGC ACC TGC 1664 
lie Ala Asp Ala Val Ala Asp Gly Ala Met Gly Thr Cys 

CTG ACC AAC GAA TAC GAT GTT ACC GGC GGT AAG GCC CAG 1703 
Leu Thr Asn Glu Tyr Asp Val Thr Gly Gly Lys Ala Gin 

GAC TTC GCT AAC GGT CGC GCA TAC TGG TCT GCA AAC ACT 1742 
Asp Phe Ala Asn Gly Arg Ala Tyr Trp Ser Ala Asn Thr 

GGC GCT TTC GGC CTG GTT GGA CGC ATC AAC GCT CGT TAC 1781 
Gly Ala Phe Gly Leu Val Gly Arg lie Asn Ala Arg Tyr 

TCT GAG CTG GGT GGA CCT GAC TCC TGG TTG GGC TAC CCA 1820 
Ser Glu Leu Gly Gly Pro Asp Ser Trp Leu Gly Tyr Pro 

ACC TCT TCT GAG TTG AAG ACA CCA GAC GGA CGT GGC CGC 1859 
Thr Ser Ser Glu Leu Lys Thr Pro Asp Gly Arg Gly Arg 

TTC GTC ACC TTC GAG CAC GGC TCC ATC TAC TGG ACC GCC 1898 
Phe Val Thr Phe Glu His Gly Ser lie Tyr Trp Thr Ala 

ACC ACT GGT CCT TGG GAA ATC CCA GGC GAT ATG CTC GCC 1937 
Thr Thr Gly Pro Trp Glu lie Pro Gly Asp Met Leu Ala 

GCA TGG GGC ACC CAG GAC TAT GAG AAG GGC AGC CTC GGC 1976 
Ala Trp Gly Thr Gin Asp Tyr Glu Lys Gly Ser Leu Gly 

TAC CCA ACC GGC GCC GCA GTT GAA TAC AAC GGT GGC CTG 2015 
Tyr Pro Thr Gly Ala Ala Val Glu Tyr Asn Gly Gly Leu 

CGC CAG CAG TTC GAA GGT GGC TAC GTA TTC CGT ACC TCC 2054 
Arg Gin Gin Phe Glu Gly Gly Tyr Val Phe Arg Thr Ser 

AAT AAC CAG TCT TAC TGG GTT CGC GGA GAA ATC TCC AAG 2093 
Asn Asn Gin Ser Tyr Trp Val Arg Gly Glu lie Ser Lys 

AAG TAC GCC GAT GAC GGA ATC TTC GCT CAG CTT GGT TTC 2132 
Lys Tyr Ala Asp Asp Gly lie Phe Ala Gin Leu Gly Phe 

CCA ACC GGC AAT GAG AAG TTG ATC AAC GGT GGC GCT TTC 2171 
Pro Thr Gly Asn Glu Lys Leu lie Asn Gly Gly Ala Phe 

CAG GAA TTC GAA AAG GGC AAC ATC TAC TGG TCC GTG TCC 2210 
Gin Glu Phe Glu Lys Gly Asn lie Tyr Trp Ser Val Ser 

FIG. 2 (3eme planche) 
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GCTAGCCTCGGGAGCTCTAGGAGATTGTGAAAAACGGGTCAAATTTCTCCGA 52 

TGCAGCGCCTATAAAAGTCGTACCAATTCCATTTGAGGGTGCTCAAGTGTGG 104 

CCAGGTTATATAACCAGTCAGTCAACTGGTCTCATTCGCTGGTCGGATGAAT 15 6 

TTAATTAAAGAAGAGACTTCATGCAGTTACCGCGCGTTTTGGCGATACACAA 208 

TTGATAAACCTAAAGAAATTTTCAAACAATTTTAATTCTTTGTGGTCATATC 260 

TGTGCGACACTGCCATAATTGAACGTGAGCATTTACCAGCCTAAATGCCCGC 312 

AGTGAGTTAAGTCTCAAAGCAAGAAGTTGCTCTTTAGGGCATCCGTAGTTTA 364 

AAACTATTAACCGTTAGGTATGACAAGCCGGTTGATGTGAACGCAGTTTTTA 416 

AAAGTTTCAGGATCAGATTTTTCACAGGCATTTTGCTCCAGCAAACGCCTAG 468 

GATGTACATGGTGCCCTCAATGGGAACCACCAACATCACTAAATGGCCCAGA 520 

TACACACTTTAAAATCGTGCGCGCATGCAGCCGAGATGGGAACGAGGAAATC 572 
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CCA GAG GCT GTT GAG GTC TTC CGT GAG CGC GAC ATC CGC 1664 
pro glu ala val glu val phe arg glu arg asp ile arg 

TTC GGA CCA GGC AAG GCA GCT AAC GCT GGT GGC GTT GCA 1703 
phe gly pro gly lys ala ala asn ala gly gly val ala 

ACC TCC GCT CTG GAG ATG CAG CAG AAC GCT TCG CGC GAT 1742 
thr ser ala leu glu met gin gin asn ala ser arg asp 

TCC TGG AGC TTC GAG TAC ACC GAC GAG CGC CTC CAG GTG 1781 
ser trp ser phe glu tyr thr asp glu arg leu gin val 

ATC ATG AAG AAC ATC TTC AAG ACC TGT GCA GAG ACC GCA 1820 
ile met lys asn ile phe lys thr cys ala glu thr ala 



GCA GAG TAT GGA CAC GAG AAC 
ala glu tyr gly his glu asn 

AAC ATT GCT GGC TTC AAG AAG 
asn ile ala gly phe lys lys 



GAT TAC GTT GTC GGC GCT 1859 
asp tyr val val gly ala 

GTA GCT GAC GCG ATG CTG 1898 
val ala asp ala met leu 



GCA CAG GGC GTC ATC TAA GACCCCTGCACTTTACTTAAACCCCTGA 1944 
ala gin gly val ile OCH 

TCCGCGTTAAGGATCAGGGATTTTTGATTTCTTCCAGGTCAATTATCCGATC 1996 
CACATGGGTTAATGCAGCTGTGCGGTGCGCAATGATGATCACCGTGGTGTCT 2048 
TTAAGCGTGGCCAGAGTCTGGGAAAGATCCGCTTGATTGAGCGCATCTTGGT 2100 
GGCTGGTGGCTTCATCGACAATCAGTACCTGAGGGGTGCGTGCCAAAGCACG 2152 
CGCCAGGCAGAGCCGTTGTTGCTGTCCGCCAGATAGGC 2190 



FIG. 17 (3eme planche) 
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DGF1: 32 mer 

5' AATTCCATGGCAATGGCCGGCCTGTCGACCCC 3' 

DGF2 : 28 mer 

5' GGGGTCGACAGGCCGGCCATTGCCATGG 3' 

0GF5 ; 120 mer 

5' CAGGCACAGGCTCAGGCCCAGGCACAGGCCCAGGCGCAGG 
CCCAGGCCCAGGCTCAGGCACAGGCGCAQGCGCAGGCGCA 
GGCACAGGCACAGGCTCAGGCGCAGGCTCAGGCTCAGGCA 3' 



DGF6: 120 mer 

t 

S TGAGCCTGAGCCTGCGCCTGAGCCTGTGCCTGTGCCTGCG 
CCTGCGCCTGCGCCTGTGCCTGAGCCTGGGCCTGGGCCTG 

CGCCTGGGCCTGTGCCTGGGCCTGAGCCTGTGCCTGTGCC 3' 
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